このページの本文へ

新清士の「メタバース・プレゼンス」 第136回

画像生成AIの歴史を変えたNano Banana “一貫性の壁”が突破された2025年を振り返る

2025年12月15日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

画像生成AIは「Nano Banana」が台風の目に

 画像AI分野には、動画AIの技術が逆輸入されることで、一貫性の実現がなされるようになりました。細かな一貫性を実現するための技術が試されていたのですが、それらの状況を一変させたのが、8月のNano Bananaの登場でした。例として、同一人物の写真に、指定した服の画像を切り替えられるようになり、大きな衝撃を与えました。アパレルEC分野で望まれていたことが一瞬でできるようになってしまいました。イラスト風やフィギュア風、人物の向きを変えるなど、画像編集の自由度が高かったことも驚きでした。(参考:グーグルの画像生成AI「Nano Banana」は異次元レベル AIコンテンツの作り方を根本から変えた

Nano Bananaを使って、夏服の明日来子さん(右)に、中央の服を着せるように指示すると、左の画像になった

 しかし、Nano Banana登場からわずか2週間後の9月にバイトダンスが「Seedream 4.0」を発表し、Nano Banana以上のことができることを示しました。さらにアリババもオープンモデル「Qwen-Image-Edit-2509」をリリース。いずれも強力な一貫性を実現できることをアピールしてきました。(参考:グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力

Seedream 4.0で生成した明日来子さんの秋服。右のTシャツ姿から、秋服を生成している

Qwen-Image-Edit-2509での服装替え。赤いセーター姿(左)から、服とカバンの画像(右)から、それを持っている状態(中央)を生成している

 それを再び上回る水準の、さらに強力な一貫性を実現したのが、11月にリリースされた「Nano Banana Pro」でした。人物の一貫性を維持しながら、ライティング、構図、ポーズなど、非常に複雑なプロンプトや画像による指定にも応じながら、精度の高い画像を作り出す点で、現状、他社を圧倒するモデルとして登場してきました。(参考:実在感が恐ろしいレベル 画像生成AIの常識をひっくり返した「Nano Banana Pro

Nano Banana Proで生成した画像

動画生成AIは「Sora 2」から新境地に入った

 動画AIは新しい領域にも入りました。10月には、OpenAIの「Sora 2」が登場したことも大きなインパクトを与えました。著作権の問題も波紋を広げましたが、詳細なプロンプトを与えなくても非常に複雑なカット割りが作れてしまうことが驚きでした。ここからAIツールは“いかにユーザーのプロンプトを忠実に再現できるか”というオーダーを超え、“いかにユーザーの意図を汲んだコンテンツを作れるか”という点が競争の軸になっていきました。(参考:「Sora 2」は何がすごい? 著作権問題も含めて整理

 そこに殴り込んできたのが、10月リリースのxAIの「Grok Imagine」です。動画系では非常に高性能で、しかも高速で安い。しかも、UI自体は単純に動画を作れるようになっている一方で、かなり複雑なプロンプト制御も実現できるということで、演出をより反映できるようになっています。SNSのXとの統合もなされていることもあり、手軽な環境として人気を集めています。(参考:xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル

△Sora2で生成した架空のソーシャルRPGのCM

△Grok Imagineで生成したイチョウ並木を歩く女性

 まとめると、画像生成AIは昨年までに、高精細・高品質・題材の多様さ・高速化といった課題をほぼクリアしてきました。一方で今年は、よりコントロール性や一貫性を高め、“正確に描写する”能力を高める方向にシフトしてきています。動画も品質が上がるにつれて、“いかに長時間(長尺)化するか”という課題も出てきましたね。

カテゴリートップへ

この連載の記事
ピックアップ