このページの本文へ

新清士の「メタバース・プレゼンス」 第89回

OpenAI「Sora」残念な離陸 中国勢が飛躍する動画生成AI

2024年12月23日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

中国MiniMax社の「Hailuo AI」が強い

 「Sora」競合の動画生成AIを比べてもみました。筆者が一番品質が良いと感じられたのは、中国MiniMax社の「Hailuo AI(ハイルオAI)」でした。今のところ、Hailuo AIは720p 6秒しか生成できないという制限がありますが、i2vが強く、プロンプトにも柔軟に合わせてくるという特徴があります。

 Nijijouney(Midjouneryのアニメ版)で作成した「コーヒーの紙コップを持った少女」のイラスト画像にコーヒーを飲ませるよう「anime girl drink coffee」とシンプルなプロンプトで設定したAI動画を各社のi2vで比較してみます。

 Shengshu Technology(勝数科技)と清華大学が共同開発した「Vidu(ビドゥ)」は飲んでくれるものの、絵柄が大きく変わります。中国Kuaishou(快手)社の「Kling AI(クリンAI)」や、定番の米「Runway(ランウェイ)」では飲む動きを見せず、ほぼ動きません。Hailuo AIのみが、元の原画に近い状態を維持したまま飲むことに成功しています。

「Runway」「Hailuo AI」とi2v比較

 では、Soraはどうかというと、試行錯誤の上に成功することができました。

 まったく違う画像が生成される対策として、先に触れたLLMで画像を解析したプロンプトに「anime girl drink coffee」とつけて生成するという方法をまずは取りました。ところがそれでは途中から違う動画が生成されるという結果になりました(左)。

 そこで、次にプロンプトをまったくつけない状態だとどうなるのかを試したところ、まったく動きませんでした(中央)。最後に「anime girl drink coffee」とのみ設定したところ、飲んでくれたという結果になりました(右)。

 これは、Soraで、アニメ系の動画を生成しようとすると、有効な方法が実写系と違っている可能性があることを示唆しています。

▲Soraでi2v 720p 10秒で生成した動画

 Hailuo AIの優秀さは、実写で試しても明らかになります。明日来子さんと自販機がある画像で、「女性が自販機のボタンを押す」というプロンプトで、同じように各社比較をやったところ、1回目でボタンを押すという結果を出せたました。一方で、他の動画サービスは、まったく後ろを振り向くことがありませんでした。

▲Hailuo AIで、1枚の画像から、自販機のボタンを押す動画を作った結果。2回生成しているが、2回とも後ろを向いてボタンを押している。ただし、自販機との距離感は少し狂い気味

 では、Soraではどうでしょうか。まず、プロンプトを「自販機に近づいて、ボタンを押す」としてみました。その結果は、別世界に切り替わってしまい自販機も建物も何もかも形状が変わってしまいました(動画の前半)。そこで、今度は画像をLLM解析を行ってプロンプトを作成し、そこに「自販機に近づいて、ボタンを押す」と英文で文頭に追加して、生成してみました(動画の後半)。2度試していますが、後ろを向いて、自販機に近づくところまでは成功しています。明日来子さんと自販機の関係性も正しく出ているように見えます。ただし、ボタンを押すところまでは成功できませんでした。

▲Soraで、i2v 720p 5秒で明日来子さんが「自販機に近づいてボタンを押す」を実行させようとした動画

カテゴリートップへ

この連載の記事
ピックアップ