グーグルが8月中旬、チャットAIサービス「Gemini」で使える画像生成AIモデルを「Imagen 3」に更新。グーグルの画像生成AIサービス「ImageFX」でImagen 3を試した人たちが驚き、「これはとんでもない」と騒ぎになりました。実際にImageFXを試してみると、性能が高いことは間違いありません。現在は、1日40回程度までは無料で使用することができます。
※一部の配信先では画像や図表等が正確に表示されないことがあります。その場合はASCII.jpに掲載の記事をご確認いただければ幸いです
フィルターはとても厳しく、女性を出すのは難しい
ただし、コンテンツフィルターがとても厳しく、暴力的な画像や性的な画像、また未成年者に見えるような画像を出すこともできないようになっています。2023年12月に前バージョンの「Imagen 2」が出されたときも「厳しすぎる」と評価がありました。特に女性を出すときが厳しかったと報告される一方、男性の画像は比較的出やすいという情報はあります。このフィルターを回避するために絵文字を使うなどの様々なテクニックが開発されつつありますが、正攻法ではうまくいきません。女性を描くにしても、「girl」などの直接的なワードを避けたりすると成功率が上がるようです。
実際に試したところ「ペットボトルの水を飲んでいる女性」は弾かれました。試行錯誤して、性別を区別するワードを消したところ、代わりに男性が出てきました。何回も生成を試すと「ペットボトルを持っている女性」の画像は出せたものの、今度はすべてが同じ女性の顔になってしまいました。特に鼻がそっくりです。どうも日本人顔は意図的に同じような顔が生成されるように調整されているように思えます。
ただ、ランダム性を前提としていますが、プロンプトをうまく設定できれば、写真と見間違えるような画像が生成されます。コンサートでの日本のアイドルをテーマにした画像は、とてつもなくリアルなものが生成できることも話題になりました。
この連載の記事
-
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは -
第77回
AI
画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に -
第76回
AI
「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」 -
第75回
AI
商業漫画にAIが使われるようになってきた -
第74回
AI
AIバブル崩壊をめぐって -
第73回
AI
AIは著作物の「フェアユース」と言えるのか 音楽業界vs.AIミュージック -
第72回
AI
人が絵を描く“工程”をAIで再現 タイムラプス風動画が炎上した「Paints-Undo」 -
第71回
AI
危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ -
第70回
AI
イラストのペン入れと色塗り、AI使えばわずか1分 - この連載の一覧へ