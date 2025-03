グーグルがハイクオリティーな動画生成AI「Veo2」のAPIを通じての提供を始めました。非常に性能は高いのですが、価格はかなり高額です。一方で、ローカルPCで動作するオープン型の高性能な動画生成AIの発表も相次いでいます。アリババの「Wan 2.1」に、テンセントの「HunyuanVideo i2v」と中国大手企業が正面からぶつかっています。それぞれのツールで実際に動画を作成しながら、その特徴を調べてみました。

※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください

2月21日にVeo2の対応をアナウンスしたのがAPI利用で様々なサービスを使えるようにしている統合的なクラウドAIサービスの「FREEPIK」です。契約して実際にやってみましたが、初印象は「品質は高いけど、値段も高い!」というものでした。Veo2はクレジットがどんどん消滅していきますね。10ドル(約1500円)のサービスなんですが、Veoを使うと、1回あたり約1ドル(150円)が溶けていく計算です。

ただ、非常に完成度の高い動画が出てきます。OpenAIの「Sora」などと比べてもしっかりした、本当に実在しそうな人間が出てきます。t2v(テキストからビデオ)を使い、この連載でおなじみのキャラクター「明日来子さん」の画像をプロンプト解析したものを入力して生成した結果がこういう感じで出てくる。Soraでも同じプロンプトから動画を生成してみましたが、Veo 2のほうが自然な印象です。これが中国系で評価の高いKling 1.6になると差がつきはじめ、人物の顔も風景もだいぶ中国っぽくなります。こうなるとVeo 2の性能の高さが際立ってきます。生成時間も速く、3分程度で生成されます。

▲Veo2、Sora、Kling 1.6との比較。プロンプトはすべて同じ

アニメ系はどうかということで試してみましたが、Veo 2は3Dっぽいアニメとして生成される傾向があり、自然な出力が出ます。一方で、Soraは本当にアニメ系の品質はイマイチで、「なんだこりゃ」というレベルにとどまっています。Kling 1.6は2Dっぽさが強調されるようです。

▲Veo2、Sora、Kling 1.6との比較。プロンプトはすべて同じ

SNSに投稿されている動画を見ていても、Veo 2は品質が圧倒的で、非常に性能が高いという印象です。ただ、値段が高いので、気軽に試行錯誤ができないという弱点はあります。運用自体も、やはりコスト高なんでしょうね。グーグルは自社サイトで有償サービスを展開するのではなく、他社にAPIを提供することを先行したわけですから。他サービスとのバランスを考えて、自社でやるのはリスクが高いと判断したのでしょう。Soraの場合は、Proプランの月200ドルで生成し放題になっていますが、同じプランを展開した場合には採算が合わないという判断があるのだと考えられます。

Google Veo 2 brings realistic cooking and food to a new level.



Check out these examples of cutting vegetables, mixing salads and frying meat in a kitchen!



Music created with Suno. pic.twitter.com/duaSP0VG6q