8月26日にリリースされたグーグルの画像AIモデル「Nano Banana(Gemini 2.5 Flash Image)」の性能の高さが話題を席巻しています。もとはAIのベンチマークサイト「LMArena」に、「nano-banana」という変な名前のモデルとして登場しました。とにかく、これまでの画像AIモデルと比べて、人物などの一貫性のレベルが段違いに高いという特徴があります。しかも、リリース後、商用版の「Gemini」だけでなく、テスト環境の「Google AI Studio」で、無料で使える環境を提供したこともあり、一般の人にまで利用や認知が広がりつつあります。また、その性能を探ろうと様々な試行錯誤がSNS上で繰り広げられています。
※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください
人物描写の一貫性が異次元レベル
これまで画像生成AIは、人物描写で一貫性が維持しづらいという課題を抱えていました。人物の顔の向きを変えたり、服を変えたりすると、生成するたびに別人になってしまうことが問題でした。それを乗り越えようと「Flux.1 Kontext」など、様々なモデルが挑戦し、成果を上げていました。(参考:“一貫性”がすごい画像生成AI 冬服→夏服も一発変換 話題の「FLUX.1 Kontext[dev]」 )
ところが、Nano Bananaはこれまでのモデルと品質が、異次元といえるレベルでの一貫性を実現しているのです。
いつも登場する作例AIモデル「明日来子さん」にいろいろな服に変身してもらいました。グーグルはAPI連携をさせたサンプルアプリとして、1枚の画像から時代別の画像を生成する「Past Forward」というアプリを公開していますが、それを使うと様々な時代の変化を生み出す画像を手軽に作れるのです。服装やポーズがそれぞれの年代に合わせて、出力されています。また、1980年代の画像を入力画像として「全身像にして写真の状態を維持したまま前、後ろ、横の三面図を作成してください」と指示すると、自然な雰囲気で出力されます。
明日来子さんの人物としての一貫性が、驚異的なレベルで維持されています。
▲上記の画像を動画AI「Wan2.2 I2V」で繋いでみたもの。最初の白いTシャツ姿が入力画像。静止画の一貫性によって自然なつながりになっている
さらには、服装を変えたりということも簡単にできます。Midjourneyで作成した服装のサンプル画像を参照して、その服に変えてと指示すると、Tシャツ姿から自然に切り替わっています。また、両手を上げてダンスをしている様子とポーズを指示したり、傘を持って雨を降らせるようにと指示しても、そのシーンを構成して画像を生成してくれます。

この連載の記事
-
第134回
AI
“AI読者”が小説執筆の支えに 感想を励みに30話まで完成 -
第133回
AI
xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル -
第132回
AI
画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」 -
第131回
AI
AIに恋して救われた人、依存した人 2.7万人の告白から見えた“現代の孤独”と、AI設計の問題点 -
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 - この連載の一覧へ










