工夫次第で動画の長さを延長可能
Grok Imagineは、記事執筆時点(23日現在)では、動画の長さとして6秒しか作れず、また始点画像しか指定できないため、融通が利かない点が課題です。
ただし、素材づくりとしては優秀です。例えば、動画を長くするために、これまでの動画生成AIで使われていたテクニックである、最終フレームから動画を“延長”する方法がそのまま使えます。
一度生成した動画の最終フレームをスクリーンショットとして切り出して、次の開始フレームにすることで、動画の続きを作るという方法です。このテクニックで強引に4回繰り返してみたのが次の動画です。こうすれば6秒の動画を24秒に延長できます。ただし、自動車が動かなくなっていたり、歩く速度が変わってしまったりと不自然な点が出てくるため、動きの少ないシーンで使うなど使い方は工夫する必要があります。もちろん、音楽や効果音は連続せず、動画は編集ソフトで結合したりする作業が必要になります。また、だんだんと後になるほど、画像の品質が劣化していく傾向もあるので、そこも工夫が必要です。
△エンドフレームを切り出す方法で、24秒の動画にしたもの
物理的な挙動もかなり正確に表現できるようです。「グラスにワインを注ぐ」という物理的な正確さが重要になる指示でも、グラスの模様が少し変わっているように見えるなど完璧ではないのですが、かなり頑張ってくれています。一定のワールドシミュレーションの能力はあるようです。(参考:「画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」)
△Grokで生成したグラスにワインを注ぐを3回試したもの
さらに、「若い女性がグラスをとってワインを飲みほす」、「犬がワインを飲み干す」、「大きなクマがグラスを取って飲み干す」などの指示にもちゃんと対応してくれました。さらに、ハンマーでグラスを割ろうとしてみたのですが、うまくいきませんでした。まだ、物理系は完璧ではないようです。
△Grokでワインを女性、犬、クマが飲み干す。ハンマーで割る
さらに、ユーザー側でプロンプトを工夫することにより、指定秒数での描写内容や、エンドフレームを強引に指定もできるとXで報告されてます。エンドフレームを指定する際は、1枚の画像にスタート/エンドの2パターンを入れておき、プロンプトで指示をするというやり方です。
まだまだ、未発見のテクニックが隠れていると考えられます。

この連載の記事
-
第134回
AI
“AI読者”が小説執筆の支えに 感想を励みに30話まで完成 -
第132回
AI
画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」 -
第131回
AI
AIに恋して救われた人、依存した人 2.7万人の告白から見えた“現代の孤独”と、AI設計の問題点 -
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 - この連載の一覧へ






