このページの本文へ

最新の画像生成AI「FLUX1.1 [pro]」違いは? Midjourney、DALL-E、Imagen 3、Stable Image Ultraと比較

2024年10月18日 17時00分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

指とテキスト

 初期の画像生成AIは「手」を描くのを苦手としていた。6本指や4本指を見かけてギョッとしたことがある人も多いだろう。また、画像内に指定した「文字」を書かせることも得意ではなかった。

 ここではその2つの要素を含んだ意地悪なプロンプトを試してみよう。

プロンプト: A hand holding a small business card reading "ASCII.jp" (「ASCII.jp」と書かれた小さな名刺を持つ手)

 1.1 [pro]で生成したものは指の破綻もなく、きちんと名刺をつまんでいるように見える。

1.1 [pro]

 1 [pro]の方も指は合格。ちょっと名刺が小さすぎる気もするが「a small business card」というプロンプトを忠実に守っているとも言える。

1 [pro]

 Midjourneyも明るくていい構図だが、見ようによっては6本指に見える画像になってしまっている。

Midjourney 6.1

 DALL-E 3は完全に6本指になってしまった。名刺に「Ascii.jp」以外の文字が入っているのは少しおもしろい。

DALL-E 3

 Imagen 3はデザインされたおしゃれな名刺になっている。ただし「ASCII」の綴が……。惜しい。

Imagen 3

 Stable Image Ultraも指がおかしいうえに、「ASCI.JP」だ。

Stable Image Ultra

 以上、Flux以外はまだ指が怪しいことが多い。個人的な優勝は1.1 [pro]ではなく1 [pro]で。

カテゴリートップへ

ピックアップ