日本の風景にもすさまじく強い
Imagen 3は、日本の風景にも強いことも話題になりました。実際に「日本の雨あがりの坂のある街」をテーマに画像を生成してみたところ、いかにも日本のどこかにありそうな風景画像が生成されました。雨が降ったあとの路面の光沢感にしても、歩道の行き先が、別の曲がった道につながっているように見えるのも、他の画像生成モデルでは見たことがない特出したクオリティーの高さです。
もちろん、細かいところを見ていくと柱の位置がおかしかったり、道幅に対して柱の置かれている場所が変だったり、遠くの町並みの過密度が高すぎる気もしますが、神奈川あたりのような雰囲気で、パッと見では見抜けないレベルです。これはすごいですね。
どれくらいImagen 3の性能が高いのか、他の画像生成AIとも比較してみました。Imagen 3が比較的短めのプロンプトでも画像を形成できるということもあり、より似せた画像を出すためImagen 3の画像を解析してプロンプトを作成しています。そのため、厳密には同じプロンプトの比較ではないことはお断りしておきます。
まず、OpenAIの「DALL-E 3」は、特有のイラストよりの画像で出るのですが、細かいところがぐちゃぐちゃになっていたり、行くことができない階段が生まれたり、AI特有の構造上のおかしなものが出ています。
絵的な魅力でImagen 3を上回ったMidjourneyは、確かに趣きはあるものの、沖縄あたりを思わせる風景になりました。注目すべきは、道路の左右に出ている手すりで、現実にはありえないおかしな形状をしています。これもAIで起こりがちな失敗です。
話題のオープンモデル「FLUX.1 dev」で生成したところ、日本から少し離れているような印象の画像になりました。FLUX.1は写真画像も強いのですが、筆者が1ヵ月月あまり使ってきた印象では、日本という地域性を絞った画像はあまり得意ではないように思えています。ドイツで開発されたということもあり、学習している情報のなかに、日本の画像が少ないのではないかと推測しています。
ついでなので、Xに搭載されたFlux.1の軽量版で生成された「Grok」でも生成してみました。さらに日本の風景から離れ、韓国や中国の風景が混じってきているように感じられます。やはり総合的に見て、Imagen 3の優位性を感じることができます。
この連載の記事
-
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは -
第77回
AI
画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に -
第76回
AI
「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」 -
第75回
AI
商業漫画にAIが使われるようになってきた -
第74回
AI
AIバブル崩壊をめぐって -
第73回
AI
AIは著作物の「フェアユース」と言えるのか 音楽業界vs.AIミュージック -
第72回
AI
人が絵を描く“工程”をAIで再現 タイムラプス風動画が炎上した「Paints-Undo」 -
第71回
AI
危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ -
第70回
AI
イラストのペン入れと色塗り、AI使えばわずか1分 -
第69回
AI
AI動画の品質が仕事に使えるレベルになってきた - この連載の一覧へ