このページの本文へ

新清士の「メタバース・プレゼンス」 第132回

画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」

2025年11月17日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

Nano Banana、Seedream 4.0と比較

 ChronoEditがこうした仕組みを取るのは、視覚的な忠実度と、物理的な妥当性を実現するためだとしています。

 そこで、光の動きや、物理現象を正確に描写する必要のある、コップの画像に「ワインを注ぐ」という指示を出してみます。コップの画像はMidjourneyで生成しました。結果としては、ワインの色味、光の加減、コップによる光の反射をうまく捉えることに成功しました。

生成された画像。48フレームの方が時間が長い分、多めに注がれる傾向がある

△生成された動画。32フレームを1回、48フレームを3回試行している

 比較として、Nano Bananaと、バイトダンスの「Seedream 4.0」と同じ条件で比べてみます。Nano Banana(上の2枚)はいずれもワインのみが追加されています。大きな違いは、コップの影が、元画像とほぼ同じように見える点です。そのため、硬質な印象を与えます。Seedream 4.0(下の2枚)は、ワインの色が机に影響を与えており、より自然な印象を与えていますが、左側はコップの汚れなどがなくなりきれいになりすぎています。右側はかなり美しい品質で出ているように思われます。

 この試行を見る限り、ChronoEditが視覚的忠実度や物理現象に強いというのは事実のようです。

 ただ、筆者が試した限りではアニメ系は必ずしも得意ではないという印象を受けました。

 2Dイラストのフィギュア化や、道路を走っているバイクが疾走するといったテーマでは、うまくいくケースも多いのですが、2次元の画像を線画にするといったものはうまくいきませんでした。元々の目標が、ワールドシミュレーションであるため、実写といったものが中心に学習されているからではないかと考えます。2Dイラストのものでも、より実写や3Dに近いもののほうが、的確に反映されるようです。

イラストタッチの画像を使った例。右側が元画像で、左が生成例

カテゴリートップへ

この連載の記事
ピックアップ