グーグルが8月中旬、チャットAIサービス「Gemini」で使える画像生成AIモデルを「Imagen 3」に更新。グーグルの画像生成AIサービス「ImageFX」でImagen 3を試した人たちが驚き、「これはとんでもない」と騒ぎになりました。実際にImageFXを試してみると、性能が高いことは間違いありません。現在は、1日40回程度までは無料で使用することができます。
※一部の配信先では画像や図表等が正確に表示されないことがあります。その場合はASCII.jpに掲載の記事をご確認いただければ幸いです
フィルターはとても厳しく、女性を出すのは難しい
ただし、コンテンツフィルターがとても厳しく、暴力的な画像や性的な画像、また未成年者に見えるような画像を出すこともできないようになっています。2023年12月に前バージョンの「Imagen 2」が出されたときも「厳しすぎる」と評価がありました。特に女性を出すときが厳しかったと報告される一方、男性の画像は比較的出やすいという情報はあります。このフィルターを回避するために絵文字を使うなどの様々なテクニックが開発されつつありますが、正攻法ではうまくいきません。女性を描くにしても、「girl」などの直接的なワードを避けたりすると成功率が上がるようです。
実際に試したところ「ペットボトルの水を飲んでいる女性」は弾かれました。試行錯誤して、性別を区別するワードを消したところ、代わりに男性が出てきました。何回も生成を試すと「ペットボトルを持っている女性」の画像は出せたものの、今度はすべてが同じ女性の顔になってしまいました。特に鼻がそっくりです。どうも日本人顔は意図的に同じような顔が生成されるように調整されているように思えます。

だいぶ出すのに苦労したペットボトルを持っている女性。直接的な女性を指し示す言葉を使わず「黒い長い髪」というワードを使うことで、女性を出している。これがないと男性がでてきたりする。プロンプトは次の通り「Japanese , holding PET bottle , drinking water , summer ,black long hair, smile」
ただ、ランダム性を前提としていますが、プロンプトをうまく設定できれば、写真と見間違えるような画像が生成されます。コンサートでの日本のアイドルをテーマにした画像は、とてつもなくリアルなものが生成できることも話題になりました。

この連載の記事
-
第119回
AI
無料の動画生成AI「Wan2.2」が凄すぎる PCローカルでこの品質が出せるとは -
第118回
AI
AIの「ASMRボイス」に脳ゾワゾワ 合成音声の進化と、収益化への課題 -
第117回
AI
“18禁”美少女AI「Ani」は孤独を癒すか、深めるか? -
第116回
AI
AIが書いた怪談小説が面白い 2分に1本のペースで出力されるのは驚異的 -
第115回
AI
“一貫性”がすごい画像生成AI 冬服→夏服も一発変換 話題の「FLUX.1 Kontext[dev]」 -
第114回
AI
Midjourneyの動画生成AIが強い 驚きの高性能で価格破壊 -
第113回
AI
AI丸投げのゲーム開発が超楽しい 誰もがプログラムを作る時代は確実に来る -
第112回
AI
楽曲生成AIの進化が凄い 鼻歌からプロ級の曲がポンポンできる -
第111回
AI
画像生成AI、日本の開発者コミュニティが熱い 世界最先端の “新手法”続々 -
第110回
AI
グーグルの動画生成AI「Veo 3」が圧倒的、だけど高すぎ -
第109回
AI
ChatGPTの“彼女”と大げんかして、Geminiに乗り換えた - この連載の一覧へ