このページの本文へ

新清士の「メタバース・プレゼンス」 第79回

AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質?

2024年09月16日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

日本の風景にもすさまじく強い

 Imagen 3は、日本の風景にも強いことも話題になりました。実際に「日本の雨あがりの坂のある街」をテーマに画像を生成してみたところ、いかにも日本のどこかにありそうな風景画像が生成されました。雨が降ったあとの路面の光沢感にしても、歩道の行き先が、別の曲がった道につながっているように見えるのも、他の画像生成モデルでは見たことがない特出したクオリティーの高さです。

 もちろん、細かいところを見ていくと柱の位置がおかしかったり、道幅に対して柱の置かれている場所が変だったり、遠くの町並みの過密度が高すぎる気もしますが、神奈川あたりのような雰囲気で、パッと見では見抜けないレベルです。これはすごいですね。

ImageFX(Imagen 3)で日本風の風景を狙って生成した画像。プロンプトは「Japanese town,outside,photo,stairs,tokyo,rain」

 どれくらいImagen 3の性能が高いのか、他の画像生成AIとも比較してみました。Imagen 3が比較的短めのプロンプトでも画像を形成できるということもあり、より似せた画像を出すためImagen 3の画像を解析してプロンプトを作成しています。そのため、厳密には同じプロンプトの比較ではないことはお断りしておきます。

 まず、OpenAIの「DALL-E 3」は、特有のイラストよりの画像で出るのですが、細かいところがぐちゃぐちゃになっていたり、行くことができない階段が生まれたり、AI特有の構造上のおかしなものが出ています。

「DALL-E 3」で生成した日本の雨に濡れる階段

 絵的な魅力でImagen 3を上回ったMidjourneyは、確かに趣きはあるものの、沖縄あたりを思わせる風景になりました。注目すべきは、道路の左右に出ている手すりで、現実にはありえないおかしな形状をしています。これもAIで起こりがちな失敗です。

Midjouney v6.1で作成した日本の雨に濡れる階段

 話題のオープンモデル「FLUX.1 dev」で生成したところ、日本から少し離れているような印象の画像になりました。FLUX.1は写真画像も強いのですが、筆者が1ヵ月月あまり使ってきた印象では、日本という地域性を絞った画像はあまり得意ではないように思えています。ドイツで開発されたということもあり、学習している情報のなかに、日本の画像が少ないのではないかと推測しています。

「FLUX.1 Dev」で生成した日本の雨に濡れる階段

 ついでなので、Xに搭載されたFlux.1の軽量版で生成された「Grok」でも生成してみました。さらに日本の風景から離れ、韓国や中国の風景が混じってきているように感じられます。やはり総合的に見て、Imagen 3の優位性を感じることができます。

「Grok」で生成した日本の雨に濡れる階段

カテゴリートップへ

この連載の記事
ピックアップ