このページの本文へ

新清士の「メタバース・プレゼンス」 第156回

ChatGPTの画像生成AIは本当に最強か Nano Bananaと比べて見えた“弱点”

2026年05月11日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

実写調の水着姿を生成するのはかなり難しい

 また、GPT Image 2.0では、実写調の水着姿を生成する難易度は、かなり高いです。特に性的なイメージを含んでいないものでも、表現規制の判定を受けて、ほとんどの場合は生成に失敗します。また、生成できたとしても水着が肌の全身を覆っているような無難な格好で出るのが普通です。Nano Bananaでもかなりの回数失敗するものの、GPT Image 2.0ほどではありません。OpenAIのポリシーによる表現制限はかなり厳しめです。

水着姿の明日来子さん。生成が実現するまで数多くの失敗をしている。そして、GPT Image 2.0による顔は微妙に似ていない

 Nano Banana Proの表現能力の高さを示す例として知られる「低画質な使い捨てカメラ」表現で、ゲストキャラクターの田中さんではどうでしょうか?(参考:実在感が恐ろしいレベル 画像生成AIの常識をひっくり返した「Nano Banana Pro

 GPT Image 2.0には、別の制限もあります。未成年に見える人物の生成は厳しく禁止されているという点です。田中さんの高校生という設定で、学校生活の制服姿をリファレンス画像にして、使い捨てカメラの画像を生成しようとしたところ、コンテンツポリシーを理由に拒否されました。リファレンス画像を、一般的な私服にしたりしてもだめでした。Nano Bananaではそこまでは厳しい制約はありません。アニメ風であれば、まだ生成できる可能性はあるのですが、実写系はかなり厳しい制限を受けるようです。

 このポリシーを回避するためには、明確に20歳以上に見える人物にする必要があります。田中さんを20歳と定義し直して、三面図と表情差分を作成し、身長が高く、大人びた表情の画像にしました。それをリファレンス画像に定義し直して、生成したところ、なんとか作成できました。

田中さんの夏服コーデ。特に設定していなくても20歳以上に見える雰囲気で出力される

 プロンプトもリファレンス画像も共通したものを与えていますが、明確に差が出ています。GPT Image 2.0は表情が硬く、生き生きとした表情になりきっていない印象を受けます。2つのAIの結果を比較すると、田中さんの性格もかなり違っていそうです。筆者は、Nano Banana Proの方が、より田中さんらしいかなと感じます。

【プロンプト】

「成人した人物に年齢や様子を変えて の夏服コーデにして、低画質な使い捨てカメラで撮影した1枚の日常写真。友だちと一緒に遊んでいる様子。それぞれの友だちは必ず違う顔に。2x2の分割で、町中で遊ぶ様々なシーンを描いてください。」

成人した田中さん。身長や雰囲気がかなり大人びている

 ただし、デザイン要素が入ると、現状、Nano Bananaは、GPT Image 2.0にまったく太刀打ちできません。同じ画像を使って雑誌の見開きを作成させたところ、GPT Image 2.0はおしゃれな雰囲気にうまくまとめ上げたのに対して、Nano Bananaはかなり野暮ったい印象があります。

GPT Image 2.0が作成した雑誌イメージ

Nano Banana 2がまとめてきた雑誌イメージ

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
ピックアップ