このページの本文へ

Stable Diffusion入門 from Thailand 第38回

最新の画像生成AIは“編集”がすごい! Nano Banana、Adobe、Canva、ローカルAIの違いを比べた

2026年01月09日 13時00分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

Nano Banana Proが示す「生成」と「編集」の境界消失体験

 生成と編集を分けて考えなくてよいAIが、現実的な存在になりつつある。その代表例として挙げられるのがグーグルの「Gemini 3 Pro Image(通称:Nano Banana Pro)」だ。

 Nano Banana Proの最大の特徴は、「生成」と「編集」の境界線が曖昧なことだ。従来のAI画像ツールでは、まず画像を作り、気に入らなければ別のツールや機能で編集する。そんな二段構えが当たり前だった。

 ところがNano Banana Proでは、画像を生成した直後に「ここの色を変えたい」「この人物を消して」と日本語で伝えるだけで、そのまま編集モードに移行する。わざわざ別の画面を開く必要もなければ、機能を切り替える手間もない。生成と編集が地続きになっており、まるで作業の途中で軌道修正をかけるような感覚だ。

 つまり、ユーザーは「いま自分が生成をしているのか、編集をしているのか」をほとんど意識しなくていい。画像を見て気になった箇所を言葉で伝え、結果を確認してまた修正を加える。このやり取りが、そのままワークフローとして完結する。

 結果的に、オブジェクトの削除や置換、背景の差し替え、テキストの修正といった作業も、特別な機能として独立していない。すべて「生成された画像に対する自然な続き」として処理される。この一体感が、Nano Banana Proの使い勝手を大きく左右している。

日本語テキストの差し替え

 特に分かりやすいのが、日本語テキストを含む画像の扱いだ。画像生成時に文字を入れ、そのあとで「この部分を『キャンペーン実施中』に変えて」と指示すれば、そのまま修正してくれる。漢字、ひらがな、カタカナが混在していても破綻しにくく、簡単なバナーや説明図なら、そのまま実用レベルで仕上がることもある。

生成時の画像。カフェの店内を背景に、日本語で「本日限定セール」という文字が描かれている

文字部分のみを自然言語で修正した例。「キャンペーン実施中」に差し替えられているが、背景やレイアウトの雰囲気は維持されている。

 これまで日本語環境では、AI生成後にPhotoshopなどで文字だけ打ち直す作業がほぼ必須だった。その手間を省ける点は、生成と編集が地続きになったことで得られた大きなメリットだ。

不要な人物を削除

 もうひとつ特徴的なのが、途中で構成を変えた場合の挙動だ。不要な人物や物を消したり、背景を入れ替えたりしても、周囲とのつながりを考慮したうえで描き直される。

 単なる部分修正ではなく、シーン全体を見直したうえで再構成されるため、編集を重ねても違和感が残りにくい。生成と編集を何度か往復しても、破綻しにくい点は実用面で効いてくる。

生成時の画像。カフェの店内で、テーブルを挟んで2人の人物が向かい合って座っている

右側の人物を削除する編集を行った例。人物がいた部分は、床や壁、テーブル配置とのつながりを考慮して自然に再構成されている

 こうした性質から、Nano Banana Proは「完成形を一発で作る」ためのツールというより、形を探りながら整えていく作業に向いている。ラフを作り、直し、方向を詰めていく。その過程をまとめて支える存在だ。

 具体的には、生成しながら構図や要素を調整する作業、バナーやUIイメージのラフ作成と微調整、説明図や資料用ビジュアルのたたき制作といった用途で力を発揮する。いずれも「完璧なものを一度で」ではなく、「ある程度のものを素早く、何度も修正しながら」作る場面だ。

 Nano Banana Proは、生成AIと編集AIの中間にあるのではない。両者を分けて考えなくてよい状態を、すでに実現している。その点で、編集系AIのひとつの完成形に近いと言える。

カテゴリートップへ

この連載の記事
ピックアップ