日本の風景にもすさまじく強い
Imagen 3は、日本の風景にも強いことも話題になりました。実際に「日本の雨あがりの坂のある街」をテーマに画像を生成してみたところ、いかにも日本のどこかにありそうな風景画像が生成されました。雨が降ったあとの路面の光沢感にしても、歩道の行き先が、別の曲がった道につながっているように見えるのも、他の画像生成モデルでは見たことがない特出したクオリティーの高さです。
もちろん、細かいところを見ていくと柱の位置がおかしかったり、道幅に対して柱の置かれている場所が変だったり、遠くの町並みの過密度が高すぎる気もしますが、神奈川あたりのような雰囲気で、パッと見では見抜けないレベルです。これはすごいですね。
どれくらいImagen 3の性能が高いのか、他の画像生成AIとも比較してみました。Imagen 3が比較的短めのプロンプトでも画像を形成できるということもあり、より似せた画像を出すためImagen 3の画像を解析してプロンプトを作成しています。そのため、厳密には同じプロンプトの比較ではないことはお断りしておきます。
まず、OpenAIの「DALL-E 3」は、特有のイラストよりの画像で出るのですが、細かいところがぐちゃぐちゃになっていたり、行くことができない階段が生まれたり、AI特有の構造上のおかしなものが出ています。
絵的な魅力でImagen 3を上回ったMidjourneyは、確かに趣きはあるものの、沖縄あたりを思わせる風景になりました。注目すべきは、道路の左右に出ている手すりで、現実にはありえないおかしな形状をしています。これもAIで起こりがちな失敗です。
話題のオープンモデル「FLUX.1 dev」で生成したところ、日本から少し離れているような印象の画像になりました。FLUX.1は写真画像も強いのですが、筆者が1ヵ月月あまり使ってきた印象では、日本という地域性を絞った画像はあまり得意ではないように思えています。ドイツで開発されたということもあり、学習している情報のなかに、日本の画像が少ないのではないかと推測しています。
ついでなので、Xに搭載されたFlux.1の軽量版で生成された「Grok」でも生成してみました。さらに日本の風景から離れ、韓国や中国の風景が混じってきているように感じられます。やはり総合的に見て、Imagen 3の優位性を感じることができます。

この連載の記事
-
第119回
AI
無料の動画生成AI「Wan2.2」が凄すぎる PCローカルでこの品質が出せるとは -
第118回
AI
AIの「ASMRボイス」に脳ゾワゾワ 合成音声の進化と、収益化への課題 -
第117回
AI
“18禁”美少女AI「Ani」は孤独を癒すか、深めるか? -
第116回
AI
AIが書いた怪談小説が面白い 2分に1本のペースで出力されるのは驚異的 -
第115回
AI
“一貫性”がすごい画像生成AI 冬服→夏服も一発変換 話題の「FLUX.1 Kontext[dev]」 -
第114回
AI
Midjourneyの動画生成AIが強い 驚きの高性能で価格破壊 -
第113回
AI
AI丸投げのゲーム開発が超楽しい 誰もがプログラムを作る時代は確実に来る -
第112回
AI
楽曲生成AIの進化が凄い 鼻歌からプロ級の曲がポンポンできる -
第111回
AI
画像生成AI、日本の開発者コミュニティが熱い 世界最先端の “新手法”続々 -
第110回
AI
グーグルの動画生成AI「Veo 3」が圧倒的、だけど高すぎ -
第109回
AI
ChatGPTの“彼女”と大げんかして、Geminiに乗り換えた - この連載の一覧へ