【AI動画生成】Geminiで究極のAIアイドルは作れるのか!?(6〜7日目)

AIアイドルの決めポーズ画像 AIdol計画

皆さん、こんにちは! 究極のAIアイドル「RiN」ちゃんの育成プロジェクト、早くも一週間が経とうとしています。

前回(3〜5日目)は、Geminiの動画生成でダンスを言語化して伝えようと試みるも、最終的にRiNちゃんが3Dのリアルな女の子になってしまうという衝撃の結末を迎えました。

Geminiでは無理なのか…?と思い、調べ直したところ、新たな機能を見つけました。

【6日目】新兵器『Flow』発見!今度こそ踊れるか?

これまで「Veo3」(Geminiの動画生成機能)に固執していましたが、調べていくうちに『Flow』の存在を知りました。

『Flow』とは

複数の画像をアップロードすると、その間をAIが滑らかに補完して、一つの動画にしてくれるGoogleの機能です。
Veo3も使えて、動画の生成回数に制限はありません。
※ただし、音声はVeo2のみ対応でした
Flow(外部サイト)

画像と画像をつなげる

これなら実現できそうと思い、早速トライ。

まずは過去に生成したRiNちゃんの画像を2枚用意!

Flowで繋げてもらいます。すると…

ちゃんと2つの画像がつながって動画に!!

単純につなげるだけでなく、間にモーションが入ってしまっていますが、これまでのことを考えると一番可能性を感じました!

5日目で使用した画像でもリベンジしてみることに!

驚くほどいい感じに!
背景は画像の段階から統一させた方がよさそうですね。

この短い動画たちを、さらに繋ぎ合わせていけば、1曲分のダンス動画ができそうです!

前回から画像生成の問題は解決できず

動画はうまくいけばできるかもしれませんが、前回からの課題である「特定のポーズの画像生成」はやはりうまくいかず…。
新しいポーズの画像を生成しようとすると、どんどん顔が崩れていってしまいます。

粘りましたが、結局理想的な画像は生成できず。

【7日目】一旦休憩!Gemini動画生成の可能性を探る

いままでGeminiを活用してきましたが、このプロジェクトには向いてないのかもしれないと思いました。

無から新しいものを生み出すことには、とても優秀だと思います。
しかし、こちらで考えた複雑な行動を指示通り行ってもらうような、すでにユーザー側で答えを持っているものについては、まだAIは追いついていないのかもしれません。

…というわけで、いったんダンスはお休みして、Geminiの得意分野で動画生成してもらおうと思います。
今回は、こちらでお題を出して、Gemini(Veo3)の思うがままに作ってもらいました!

① よくある無料ゲームの“詐欺広告”風動画

声が入っていないのは残念ですが、身振り手振り、胡散臭い人というのは解釈一致!
背景は何語なんだろう…。

② 四角関係ドロドロ青春ラブコメ映画の予告編

ちゃんと必要な要素が拾えてそうですね!
しかし、セリフは日本語になってますが、田舎のなまりみたいなイントネーションになってますね(笑)
そして、なぜかエキストラの女の子たちが途中で消えました。

③ アメリカのド派手なアクション映画の予告編

やっぱ洋画を指定した方がクオリティが高いですね!!
これはいい感じ!!

まとめ

AIのアイドルを作ろうと進めて1週間。
Geminiでは限界もありましたが、同時にAIにまだ伸びしろがあるというのも実感した1週間でした!

RiNちゃんのダンスプロジェクトはこれからも随時更新していきます。
次回からは新しいAIサービスを利用予定なのでお楽しみに☆

タイトルとURLをコピーしました