このページの本文へ

新清士の「メタバース・プレゼンス」 第110回

グーグルの動画生成AI「Veo 3」が圧倒的、だけど高すぎ

2025年06月09日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

ラーメンはもはやAIと見抜くのが難しい

 コストはかなり高いものの、Veo 3は少し触っただけでもその性能の高さを感じられます。

 わかりやすい例として、女の子がラーメンを食べる動画で試してみました。画像生成AI全般に言えることですが、動画AIでも、「人物、箸、麺」といった複数の構成物との関係を的確に描くことが苦手なため、どこかに破綻が残った動画を生み出しがちです。

 旧モデルのVeo 2は、最新動画AIとしては相当高い性能を持っていました(参考:動画生成AIの進化がすごい 「超リアル」「ローカルで動く」2つの方向に)。それでも完璧ではなく、Veo 2で「ラーメン屋でおいしそうにラーメンを食べる若い女性」というプロンプトで生成した動画は一部に不自然さが残ります。日本のラーメン屋的な雰囲気はよく出ているのですが、箸ではなくレンゲで麺をすくいあげたり、一瞬、食品サンプルのように麺がかたまったり、カットが途中突然飛んだりと、不自然な表現になっていました。

 一方、Veo 3では、それらの難点がほぼ完璧に解決されています。動きは非常になめらかで、箸の使い方も完璧。スープからすくいあげた麺が揺れる様子もしっかり表現されていました。アニメ風にしても表現は自然です。自動で音声を生成してくれる「Audio」機能も最初からついているため、話し声、食べる音、店内の音声なども追加されています。この水準まで来ると、もはやAI生成動画であることを見ただけで見抜くのは難しいリアルさです。

実写動画のリアリティーは異次元に

 この連載ではおなじみの作例キャラクター「明日来子さん」の画像を使い、カメラアングルの変更を試してみました。ドローンカメラのように街の上空からの視点に移動するように指示したところ、なめらかに俯瞰視点へと移ってくれます。Veo 2でも試しましたが、カットが突然切り替わってしまい、連続性が切れてしまいました。

 次に、明日来子さんの背後に飛行機を飛ばすプロンプトを試しました。Veo 3では、飛行機が起こす風によって揺れる草や髪の動きまでもがしっかり描写されます。一方で、Veo 2では前景に入っている草原のディテールが失われ、溶けるようにぼやけてしまいました。また飛行機の動きやサイズ感がなにか不自然です。一方、やはり生成内容のリアリティーがまったく違いますね。

 アニメ風の動画もなかなか優秀です。画像生成サービス「Midjourney」で作ったアニメタッチのイラストを動かしてみると、普通に見られる品質の動画ができます。

▲Midjouneryなどで作成した画像から、Veo 3でアニメーションにした動画6種類。様々な画風の表現も問題なく表現できる。ただし動きについては、かなり運の要素が強い。

カテゴリートップへ

この連載の記事
ピックアップ