皆さん、こんにちは! 究極のAIアイドル「RiN」ちゃんの育成プロジェクト、早くも一週間が経とうとしています。
前回(3〜5日目)は、Geminiの動画生成でダンスを言語化して伝えようと試みるも、最終的にRiNちゃんが3Dのリアルな女の子になってしまうという衝撃の結末を迎えました。
Geminiでは無理なのか…?と思い、調べ直したところ、新たな機能を見つけました。
【6日目】新兵器『Flow』発見!今度こそ踊れるか?
これまで「Veo3」(Geminiの動画生成機能)に固執していましたが、調べていくうちに『Flow』の存在を知りました。
『Flow』とは
複数の画像をアップロードすると、その間をAIが滑らかに補完して、一つの動画にしてくれるGoogleの機能です。
Veo3も使えて、動画の生成回数に制限はありません。
※ただし、音声はVeo2のみ対応でした
Flow(外部サイト)
画像と画像をつなげる
これなら実現できそうと思い、早速トライ。
まずは過去に生成したRiNちゃんの画像を2枚用意!


Flowで繋げてもらいます。すると…
ちゃんと2つの画像がつながって動画に!!
単純につなげるだけでなく、間にモーションが入ってしまっていますが、これまでのことを考えると一番可能性を感じました!
5日目で使用した画像でもリベンジしてみることに!
驚くほどいい感じに!
背景は画像の段階から統一させた方がよさそうですね。
この短い動画たちを、さらに繋ぎ合わせていけば、1曲分のダンス動画ができそうです!
前回から画像生成の問題は解決できず
動画はうまくいけばできるかもしれませんが、前回からの課題である「特定のポーズの画像生成」はやはりうまくいかず…。
新しいポーズの画像を生成しようとすると、どんどん顔が崩れていってしまいます。




粘りましたが、結局理想的な画像は生成できず。
【7日目】一旦休憩!Gemini動画生成の可能性を探る
いままでGeminiを活用してきましたが、このプロジェクトには向いてないのかもしれないと思いました。
無から新しいものを生み出すことには、とても優秀だと思います。
しかし、こちらで考えた複雑な行動を指示通り行ってもらうような、すでにユーザー側で答えを持っているものについては、まだAIは追いついていないのかもしれません。
…というわけで、いったんダンスはお休みして、Geminiの得意分野で動画生成してもらおうと思います。
今回は、こちらでお題を出して、Gemini(Veo3)の思うがままに作ってもらいました!
① よくある無料ゲームの“詐欺広告”風動画
声が入っていないのは残念ですが、身振り手振り、胡散臭い人というのは解釈一致!
背景は何語なんだろう…。
② 四角関係ドロドロ青春ラブコメ映画の予告編
ちゃんと必要な要素が拾えてそうですね!
しかし、セリフは日本語になってますが、田舎のなまりみたいなイントネーションになってますね(笑)
そして、なぜかエキストラの女の子たちが途中で消えました。
③ アメリカのド派手なアクション映画の予告編
やっぱ洋画を指定した方がクオリティが高いですね!!
これはいい感じ!!
まとめ
AIのアイドルを作ろうと進めて1週間。
Geminiでは限界もありましたが、同時にAIにまだ伸びしろがあるというのも実感した1週間でした!
RiNちゃんのダンスプロジェクトはこれからも随時更新していきます。
次回からは新しいAIサービスを利用予定なのでお楽しみに☆