グーグルが8月中旬、チャットAIサービス「Gemini」で使える画像生成AIモデルを「Imagen 3」に更新。グーグルの画像生成AIサービス「ImageFX」でImagen 3を試した人たちが驚き、「これはとんでもない」と騒ぎになりました。実際にImageFXを試してみると、性能が高いことは間違いありません。現在は、1日40回程度までは無料で使用することができます。
※一部の配信先では画像や図表等が正確に表示されないことがあります。その場合はASCII.jpに掲載の記事をご確認いただければ幸いです
フィルターはとても厳しく、女性を出すのは難しい
ただし、コンテンツフィルターがとても厳しく、暴力的な画像や性的な画像、また未成年者に見えるような画像を出すこともできないようになっています。2023年12月に前バージョンの「Imagen 2」が出されたときも「厳しすぎる」と評価がありました。特に女性を出すときが厳しかったと報告される一方、男性の画像は比較的出やすいという情報はあります。このフィルターを回避するために絵文字を使うなどの様々なテクニックが開発されつつありますが、正攻法ではうまくいきません。女性を描くにしても、「girl」などの直接的なワードを避けたりすると成功率が上がるようです。
実際に試したところ「ペットボトルの水を飲んでいる女性」は弾かれました。試行錯誤して、性別を区別するワードを消したところ、代わりに男性が出てきました。何回も生成を試すと「ペットボトルを持っている女性」の画像は出せたものの、今度はすべてが同じ女性の顔になってしまいました。特に鼻がそっくりです。どうも日本人顔は意図的に同じような顔が生成されるように調整されているように思えます。
ただ、ランダム性を前提としていますが、プロンプトをうまく設定できれば、写真と見間違えるような画像が生成されます。コンサートでの日本のアイドルをテーマにした画像は、とてつもなくリアルなものが生成できることも話題になりました。
この連載の記事
-
第88回
AI
1枚の画像から、歩き回れる“世界”ができる 来年のAIは「ワールドモデル」がやばい -
第87回
AI
画像生成AIの進化が早すぎる 2024年に起きたことまとめ -
第86回
AI
イラストに強すぎる画像生成AIモデル SDXL系「NoobAI-XL」の衝撃 -
第85回
AI
3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 -
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 - この連載の一覧へ