このページの本文へ

Stable Diffusion入門 from Thailand 第41回

グーグル画像生成AI「Nano Banana 2」が変えた3つのポイント

2026年03月06日 17時00分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

キャラの一貫性を保つ

 漫画、教材、広告キャンペーンのように複数枚をセットで使う制作では、単発の完成度より「揃っているかどうか」が問題になる。従来の画像生成は、プロンプトを少し変えただけで「髪色が変わる」「服のディテールが消える」「背景のトーンがずれる」といった揺れが出やすかった。各画像が独立して生成される構造上、前の出力との整合が保証されにくいからだ。その揺れを揃えるために再生成やレタッチを繰り返す手間が、制作コストとして積み上がっていた。

 Nano Banana 2は最大5キャラクター・最大14オブジェクトの一貫性維持を強化ポイントとして挙げている。参照画像を渡すことで、複数シーンを通じてキャラクターの外見を維持できるとのことだ。

 今回はまずキャラクターの3面図を生成し、それを参照画像として各シーンを生成する流れで検証した。

プロンプト(3面図):架空のアニメ風キャラクター。元気いっぱいハイティーン日本人女性、ショートボブのピンク髪、ゴテゴテしたデザインのコスプレ風衣装。明るい表情。白背景。正面・横・後ろの3面図。

3面図

プロンプト(カフェ):この画像のキャラクターを使って、カフェでコーヒーを飲んでいるシーンを描いてください。キャラクターの髪色・衣装・顔立ちを維持してください。アニメ風イラスト。

カフェで一休み

プロンプト(カラオケ):この画像のキャラクターを使って、カラオケルームではしゃいでマイクを持って歌っているシーンを描いてください。キャラクターの髪色・衣装・顔立ちを維持してください。アニメ風イラスト。

カラオケでハッスル

プロンプト(本屋):この画像のキャラクターを使って、本屋で棚から本を選んでいるシーンを描いてください。キャラクターの髪色・衣装・顔立ちを維持してください。アニメ風イラスト。

本屋でお買い物

 3シーンを通じて、髪色・衣装・アクセサリーの細部が維持されている。シーンごとに表情とポーズは自然に変化しており、同一キャラクターが異なる場面に登場する連作として成立している。ブーツのデザインにわずかな揺れはあるが、連作として並べたときの安定度は従来より明らかに上がっている。シリーズとして横に並べたときの一貫性が価値を決める用途では、この改善は実用上の差になる。

カテゴリートップへ

この連載の記事
ピックアップ