中国MiniMax社の「Hailuo AI」が強い
「Sora」競合の動画生成AIを比べてもみました。筆者が一番品質が良いと感じられたのは、中国MiniMax社の「Hailuo AI(ハイルオAI)」でした。今のところ、Hailuo AIは720p 6秒しか生成できないという制限がありますが、i2vが強く、プロンプトにも柔軟に合わせてくるという特徴があります。
Nijijouney(Midjouneryのアニメ版)で作成した「コーヒーの紙コップを持った少女」のイラスト画像にコーヒーを飲ませるよう「anime girl drink coffee」とシンプルなプロンプトで設定したAI動画を各社のi2vで比較してみます。
Shengshu Technology(勝数科技)と清華大学が共同開発した「Vidu(ビドゥ)」は飲んでくれるものの、絵柄が大きく変わります。中国Kuaishou(快手)社の「Kling AI(クリンAI)」や、定番の米「Runway(ランウェイ)」では飲む動きを見せず、ほぼ動きません。Hailuo AIのみが、元の原画に近い状態を維持したまま飲むことに成功しています。
「Runway」「Hailuo AI」とi2v比較
では、Soraはどうかというと、試行錯誤の上に成功することができました。
まったく違う画像が生成される対策として、先に触れたLLMで画像を解析したプロンプトに「anime girl drink coffee」とつけて生成するという方法をまずは取りました。ところがそれでは途中から違う動画が生成されるという結果になりました(左)。
そこで、次にプロンプトをまったくつけない状態だとどうなるのかを試したところ、まったく動きませんでした(中央)。最後に「anime girl drink coffee」とのみ設定したところ、飲んでくれたという結果になりました(右)。
これは、Soraで、アニメ系の動画を生成しようとすると、有効な方法が実写系と違っている可能性があることを示唆しています。
▲Soraでi2v 720p 10秒で生成した動画
Hailuo AIの優秀さは、実写で試しても明らかになります。明日来子さんと自販機がある画像で、「女性が自販機のボタンを押す」というプロンプトで、同じように各社比較をやったところ、1回目でボタンを押すという結果を出せたました。一方で、他の動画サービスは、まったく後ろを振り向くことがありませんでした。
▲Hailuo AIで、1枚の画像から、自販機のボタンを押す動画を作った結果。2回生成しているが、2回とも後ろを向いてボタンを押している。ただし、自販機との距離感は少し狂い気味
では、Soraではどうでしょうか。まず、プロンプトを「自販機に近づいて、ボタンを押す」としてみました。その結果は、別世界に切り替わってしまい自販機も建物も何もかも形状が変わってしまいました(動画の前半)。そこで、今度は画像をLLM解析を行ってプロンプトを作成し、そこに「自販機に近づいて、ボタンを押す」と英文で文頭に追加して、生成してみました(動画の後半)。2度試していますが、後ろを向いて、自販機に近づくところまでは成功しています。明日来子さんと自販機の関係性も正しく出ているように見えます。ただし、ボタンを押すところまでは成功できませんでした。
▲Soraで、i2v 720p 5秒で明日来子さんが「自販機に近づいてボタンを押す」を実行させようとした動画
この連載の記事
-
第88回
AI
1枚の画像から、歩き回れる“世界”ができる 来年のAIは「ワールドモデル」がやばい -
第87回
AI
画像生成AIの進化が早すぎる 2024年に起きたことまとめ -
第86回
AI
イラストに強すぎる画像生成AIモデル SDXL系「NoobAI-XL」の衝撃 -
第85回
AI
3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 -
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 - この連載の一覧へ