このページの本文へ

Stable Diffusion入門 from Thailand 第23回

最新の画像生成AI「FLUX1.1 [pro]」違いは? Midjourney、DALL-E、Imagen 3、Stable Image Ultraと比較

2024年10月18日 17時00分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

競合モデルとの比較

 去年まではStable DiffusionとMidjourneyの2択だった画像生成AIサービスも、最近は高性能なモデルが次々と発表されて、選択肢も増えてきた。

 ここからは現在最新鋭と言ってもいいだろう4つのモデルをFLUX1.1 [pro]と同じプロンプトを使って比較、傾向を探っていこうと思う。

 まずは2024年7月に発表されたMidjourneyの最新モデル「Midjourney 6.1」で生成。Fluxと比べるとよりサイバーパンク感が増している。

Midjourney 6.1

 次に、発表されたのは2023年の9月だが、2024年の8月より無料版ChatGPTでも利用可能になったOpenAIの「DALL-E 3」で試してみよう。

 これまで試したモデルとはかなり傾向の違う画像になった。特に背景にあまりブラーがかかっていないのが特徴だ。

DALL-E 3

 2024年8月にグーグルが発表した「Imagen 3」は、10月10日より同社のAIアシスタント「Gemini」でも利用できるようになったことで話題だ。

 ただし、現在Geminiでは人物を描くことを制限されているため、今回は「Image FX」を利用して生成することにする。仕様上、正方形の画像しか生成できないのでご了承願いたい。

 いわゆる「AIっぽく」ないリアルな人物を生成できることで話題のモデル。たしかにこれまでこのプロンプトで出してきたものとはかなり異なるテイストのお姉さんが生成された。

Imagen 3

 最後はStability.aiによる最新モデル「Stable Diffusion 3」を元にした「Stable Image Ultra」を同社の有料画像生成サービス「Stable Assistant」経由で試してみた。

 これまた独特のネオンぽい色彩で生成された。これまでのモデルでいちばんギラギラしているのではないだろうか。

Stable Image Ultra

 以上、4つの最新モデル(DALL-E 3だけ少し古いが)で同じプロンプトを使って生成してみたところかなり違いが見られた。他のプロンプトでも違いを見てみよう。

カテゴリートップへ

この連載の記事
ピックアップ