このページの本文へ

前へ 1 2 3 4 5 次へ

新清士の「メタバース・プレゼンス」 第79回

AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質?

2024年09月16日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 グーグルが8月中旬、チャットAIサービス「Gemini」で使える画像生成AIモデルを「Imagen 3」に更新。グーグルの画像生成AIサービス「ImageFX」でImagen 3を試した人たちが驚き、「これはとんでもない」と騒ぎになりました。実際にImageFXを試してみると、性能が高いことは間違いありません。現在は、1日40回程度までは無料で使用することができます。

※一部の配信先では画像や図表等が正確に表示されないことがあります。その場合はASCII.jpに掲載の記事をご確認いただければ幸いです

ImageFXの画面。左側にプロンプトを入力し、一度に4枚生成される

フィルターはとても厳しく、女性を出すのは難しい

 ただし、コンテンツフィルターがとても厳しく、暴力的な画像や性的な画像、また未成年者に見えるような画像を出すこともできないようになっています。2023年12月に前バージョンの「Imagen 2」が出されたときも「厳しすぎる」と評価がありました。特に女性を出すときが厳しかったと報告される一方、男性の画像は比較的出やすいという情報はあります。このフィルターを回避するために絵文字を使うなどの様々なテクニックが開発されつつありますが、正攻法ではうまくいきません。女性を描くにしても、「girl」などの直接的なワードを避けたりすると成功率が上がるようです。

 実際に試したところ「ペットボトルの水を飲んでいる女性」は弾かれました。試行錯誤して、性別を区別するワードを消したところ、代わりに男性が出てきました。何回も生成を試すと「ペットボトルを持っている女性」の画像は出せたものの、今度はすべてが同じ女性の顔になってしまいました。特に鼻がそっくりです。どうも日本人顔は意図的に同じような顔が生成されるように調整されているように思えます。

「ペットボトルを持つ学生」で出てきた男性

だいぶ出すのに苦労したペットボトルを持っている女性。直接的な女性を指し示す言葉を使わず「黒い長い髪」というワードを使うことで、女性を出している。これがないと男性がでてきたりする。プロンプトは次の通り「Japanese , holding PET bottle , drinking water , summer ,black long hair, smile」

 ただ、ランダム性を前提としていますが、プロンプトをうまく設定できれば、写真と見間違えるような画像が生成されます。コンサートでの日本のアイドルをテーマにした画像は、とてつもなくリアルなものが生成できることも話題になりました。

ピースサインをしているコンサート中の日本のアイドル。もう写真と言われてもわからないだろう。プロンプトは「japanese idol woman singing in concert, long hair, white dress ,make a peace sign」

前へ 1 2 3 4 5 次へ

カテゴリートップへ

この連載の記事
ピックアップ