このページの本文へ

前へ 1 2 3 4 5 次へ

新清士の「メタバース・プレゼンス」 第132回

画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」

2025年11月17日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

本来の用途は自動運転やロボット開発

 ChronoEditは「ワールドシミュレーション」の実現を目指して作られているという違いがあります。影・接地・反射・接触・動きが破綻しないように生成結果を生み出し、物理的にもっともらしい一貫した世界の結果を生み出されることが目標となっています。

 ここで言う「ワールドシミュレーション」とは、自動運転シーンや、ロボットが物体を操作するシーン、VRといった仮想空間を書き換えるシーンなど、「世界の状態を変えたとき、見え方が物理的に困る系の総称」のことを意味します。

 これは、クリエイター向けの画像編集ツールを目指して作られているNano BananaやSeedream 4.0と大きな違いとも言えます。

 ChronoEditは、静止画1枚を示し、ここでUターンしたことにするとか、ロボットアームがポテトを持って動かしたことにするとか、車のドアが開いて人が降りられるような状態にする──といったプロンプトの指示に合わせて、物理的に筋が通った変化の状態を持った画像を生成できるようにするという目標を持っています。

 それは、時間とともに変化する世界を、画像生成を通じて自由に生み出せる世界です。ワールドシミュレーションの精度が向上すると、現実でいちいち用意しなくても「あり得たかもしれない世界」を物理的にもっともらしく量産できるようになるのです。これは、例えば自動運転やロボット系で、危ないシーンを安全にいくらでも生成できるようになるため、様々なテスト環境の構築が安価かつ効率的にできるようになるのです。

 ワールドシミュレーションは、グーグルの「Veo3.1」や、OpenAIの「Sora 2」といった動画AIの分野では、意識されている領域でもあります。動画AIの研究が、画像AIに影響を与える流れも続いています。

 NVIDIAはロボット開発などに使えるワールドシミュレーションの環境構築のために、継続的に力を注いできていますが、その一環といえます。

 もちろん、このモデルも比較的扱いやすいため、正確な物理描写をうまく使った映像表現も登場してくるかもしれません。

 

筆者紹介:新清士(しんきよし)

1970年生まれ。株式会社AI Frog Interactive代表。デジタルハリウッド大学大学院教授。慶應義塾大学商学部及び環境情報学部卒。ゲームジャーナリストとして活躍後、VRマルチプレイ剣戟アクションゲーム「ソード・オブ・ガルガンチュア」の開発を主導。現在は、新作のインディゲームの開発をしている。著書に『メタバースビジネス覇権戦争』(NHK出版新書)がある。

前へ 1 2 3 4 5 次へ

カテゴリートップへ

この連載の記事
ピックアップ