このページの本文へ

Stable Diffusion入門 from Thailand 第17回

人気の画像生成AI、違いは? Stable Diffusion XL、Midjourney、DALL-E、Playgroundの画風を比較する

2024年07月10日 20時00分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

1.リアル美少女

ベースプロンプト:リアル美少女

プロンプト:A photorealistic portrait of a young woman with dyed pastel pink hair and subtle makeup, wearing trendy streetwear, standing in a bustling urban crossing with neon signs in the background(若い女性のフォトリアリスティックな肖像で、パステルピンクに染めた髪と控えめなメイクが特徴です。トレンディなストリートウェアを着ており、背景にネオン看板が光る賑やかな都市の交差点に立っています)

DALL-E 3

Midjourney v6

SDXL

Playground

 「パステルピンクに染めた髪」「控えめなメイク」「トレンディなストリートウェア」といったプロンプトへの追随性はどのモデルも良好だ。肌の質感などフォトリアリスティックな表現に関してはMidjourneyが群を抜いている。DALL-E 3のみ写真というよりイラストに見えるかも。

 ただし、どのモデルも明示的に指定しない限り西欧系の顔立ちになるので、「20代のリアルな日本人美少女」というベースプロンプトでも試してみよう。

1-2.リアル美少女(アジア系)

ベースプロンプト:20代のリアルな日本人美少女

プロンプト:A photorealistic portrait of a young Japanese woman with long black hair and natural makeup, wearing a casual white blouse, sitting in a modern Tokyo cafe with soft window light(若い日本人女性のフォトリアリスティックな肖像で、長い黒髪とナチュラルメイクが特徴です。カジュアルな白いブラウスを着て、東京のモダンなカフェに座っています。窓からの柔らかい光が彼女を照らしています)

DALL-E 3

Midjourney v6

SDXL

Playground

 ばっちり「長い黒髪とナチュラルメイク」の日本人女性が生成された。Midjourneyは「カジュアルな白いブラウス」の表現が際立ってすぐれている一方「東京のモダンなカフェ」感に欠ける。全体的に顔の系統は似通っているが、DALL-E 3だけ少し違っていちばん好みだ。

カテゴリートップへ

この連載の記事
ピックアップ