このページの本文へ

最新の画像生成AI「FLUX1.1 [pro]」違いは? Midjourney、DALL-E、Imagen 3、Stable Image Ultraと比較

2024年10月18日 17時00分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

短いプロンプト

 Flux 1.1 [pro]には、ユーザーのプロンプトをより詳細なプロンプトに自動的に拡張する「アップサンプリング」機能があるため、短いプロンプトでも創造的な画像を生成できるという。

 その例として「Vintage photography(古い写真)」というキーワードを頭に入れるというテクニックが紹介されていたので試してみることにしよう。プロンプトは以下。

プロンプト:Vintage photography. A woman combing her hair next to a ghost.(ビンテージフォト。幽霊の隣で髪をとかす女性)

 1.1 [pro]にこのプロンプトを入れて生成すると、内部的には以下のようなプロンプトに拡張されて生成される。

プロンプト:A black-and-white vintage photograph of a Caucasian woman with shoulder-length blonde hair, sitting at a vanity, combing her hair, while a ghost of a Victorian gentleman in a waistcoat stands beside her, looking towards the mirror.(肩まで伸ばしたブロンドヘアの白人女性が化粧台に座り、髪をとかしている様子を写したモノクロのヴィンテージ写真。彼女の横には、ベストを着たビクトリア朝の紳士の亡霊が立っており、鏡の方を向いている。)

 まるで映画のワンシーンのような雰囲気のある画像が生成された。ただ、「A black-and-white vintage photograph(モノクロのビンテージフォト)」というプロンプトが無視されているのは気になる。

1.1 [pro]

 こちらは1 [pro]の画像。1.1 [pro]のようなプロンプトの拡張は行われていないがくすんだ色合いのムードある画像になっている。ただしこちらもビンテージフォト要素は少ない。

1 [pro]

 Midjourneyはばっちりビンテージフォトの雰囲気を出してきているが、お嬢さんが幽霊の口にブラシを突っ込んでいるという謎のシチュエーションになっている。

Midjourney 6.1

 DALL-E 3はビンテージフォトというよりはセピア色で描かれた絵という感じだ。女性が幽霊に髪をとかされているのはこれだけ。

DALL-E 3

 Imagine 3はホーンテッドハウス感あふれる半透明の幽霊がよい。クシをもってても髪をとかしてはいないが。

Imagen 3

 ビンテージフォトの表現はStable Image Ultraがベスト。女性の顔が髪の毛などによって壊れているのは惜しいが、かえって不条理アートにも見えてくるところがおもしろい。

Stable Image Ultra

 1.1 [pro]の独自性も捨てがたいが、個人的好みで言えばベストはStable Image Ultra。

カテゴリートップへ

ピックアップ