このページの本文へ

前へ 1 2 3 4 次へ

新清士の「メタバース・プレゼンス」 第98回

動画生成AIの進化がすごい 「超リアル」「ローカルで動く」2つの方向に

2025年03月10日 07時00分更新

文● 新清士

  • お気に入り
  • 本文印刷

Veo2で作成した日本の町並みを歩く女性(筆者作成)

 グーグルがハイクオリティーな動画生成AI「Veo2」のAPIを通じての提供を始めました。非常に性能は高いのですが、価格はかなり高額です。一方で、ローカルPCで動作するオープン型の高性能な動画生成AIの発表も相次いでいます。アリババの「Wan 2.1」に、テンセントの「HunyuanVideo i2v」と中国大手企業が正面からぶつかっています。それぞれのツールで実際に動画を作成しながら、その特徴を調べてみました。

※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください

グーグル「Veo 2」価格は高いが圧倒的

 2月21日にVeo2の対応をアナウンスしたのがAPI利用で様々なサービスを使えるようにしている統合的なクラウドAIサービスの「FREEPIK」です。契約して実際にやってみましたが、初印象は「品質は高いけど、値段も高い!」というものでした。Veo2はクレジットがどんどん消滅していきますね。10ドル(約1500円)のサービスなんですが、Veoを使うと、1回あたり約1ドル(150円)が溶けていく計算です。

FREEPIKの画面。動画生成のCustomを選択するとVeo 2が選択できる

 ただ、非常に完成度の高い動画が出てきます。OpenAIの「Sora」などと比べてもしっかりした、本当に実在しそうな人間が出てきます。t2v(テキストからビデオ)を使い、この連載でおなじみのキャラクター「明日来子さん」の画像をプロンプト解析したものを入力して生成した結果がこういう感じで出てくる。Soraでも同じプロンプトから動画を生成してみましたが、Veo 2のほうが自然な印象です。これが中国系で評価の高いKling 1.6になると差がつきはじめ、人物の顔も風景もだいぶ中国っぽくなります。こうなるとVeo 2の性能の高さが際立ってきます。生成時間も速く、3分程度で生成されます。

▲Veo2、Sora、Kling 1.6との比較。プロンプトはすべて同じ

 アニメ系はどうかということで試してみましたが、Veo 2は3Dっぽいアニメとして生成される傾向があり、自然な出力が出ます。一方で、Soraは本当にアニメ系の品質はイマイチで、「なんだこりゃ」というレベルにとどまっています。Kling 1.6は2Dっぽさが強調されるようです。

▲Veo2、Sora、Kling 1.6との比較。プロンプトはすべて同じ

 SNSに投稿されている動画を見ていても、Veo 2は品質が圧倒的で、非常に性能が高いという印象です。ただ、値段が高いので、気軽に試行錯誤ができないという弱点はあります。運用自体も、やはりコスト高なんでしょうね。グーグルは自社サイトで有償サービスを展開するのではなく、他社にAPIを提供することを先行したわけですから。他サービスとのバランスを考えて、自社でやるのはリスクが高いと判断したのでしょう。Soraの場合は、Proプランの月200ドルで生成し放題になっていますが、同じプランを展開した場合には採算が合わないという判断があるのだと考えられます。

△AIエデュケーターのJerrod Lewさんが投稿したVeo 2を使って料理するシーンを組み合わせた動画。短いカットの組み合わせだが、品質の高さは動画AIのなかで突出している

 また、Veo 2は、動画AIにとってより重要なi2v(画像から動画)は、クローズドベータとしてのみ提供されている段階で、現状サービスは開始されていません。今後公開の予定はあるようですが、開始時期は明らかにされていません。t2vの場合は、毎回のランダム性が高いため、同じ人物やキャラクターを出すハードルは高いですが、とりあえず短めの高品質動画を作成するには便利と言えると思います。ただ、リリース後、値段の高さがネックになっているのか、SNSの投稿の様子からは、大人気とは言えないようです。

前へ 1 2 3 4 次へ

カテゴリートップへ

この連載の記事
ピックアップ