このページの本文へ

新清士の「メタバース・プレゼンス」 第79回

AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質?

2024年09月16日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

京都や広島も「それっぽい」風景が出てくる

 さらに、地名を絞ると面白いことになります。どうも、Imagen 3は日本の地方都市もきちんと認識して生成できるようなのです。

 例えば「京都」と入れると、ぱっと見ると「京都らしい」と認知してしまう知ってるような知らないような不思議な風景が出てきます。五重の塔らしきものが写っていて、観光地として有名な産寧坂(三年坂とも呼ばれる)のようにも見えるのですが、実際に山は見えません。ただ、山の上に鉄塔のようなものが見え、日本風の雰囲気を感じさせるのがポイント高いですね。

Imagen 3が作り出した京都の写真。プロンプトは「Kyoto , slopes , temple towers , townscape , street」

 そして、筆者の出身地でもある「広島」を入れてみたところ、見おぼえのある川べりの風景に貸しボート小屋っぽいものが生成されました。広島ということで、かなりの確率で原爆ドームも出てきます。もちろん位置関係はデタラメなのですが、かなり雰囲気が出ています。

 面白いのは、原爆ドームと一緒に黒い四角いビルが出てくること。実はこれ、広島商工会議所なんですよね。原爆ドームの写真を平和公園側から撮るとき、必ずと言っていいほど後ろに写り込むんです。恐らく原爆ドームの写真を学習したとき、一緒に商工会議所のイメージも学習しているのではないかと思います。

Imagen 3で生成した広島の風景「slopes , townscape , Hiroshima」。左側の黒いビルが、広島商工会議所を連想させる

 なぜこんなにもしっかりと日本の地方都市が出せるのか。

 少なくとも、LAIONデータベースなどの情報で学習したものではデータ量が限られるので不可能だと考えられます。実際に、MidjourneyやFlux.1ではこうした精度で出力することはできません。

Midjourney v6.1で作成した塔のある京都(左)と広島の坂(右)。やはり趣があるが、写真的な正確性という意味ではImagen 3が上に見える。ただ、Midjourneyも広島という単語には反応しており、瀬戸内海のような雰囲気は出ている

カテゴリートップへ

この連載の記事
ピックアップ