このページの本文へ

Stable Diffusion入門 from Thailand 第17回

人気の画像生成AI、違いは? Stable Diffusion XL、Midjourney、DALL-E、Playgroundの画風を比較する

2024年07月10日 20時00分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

2.アニメ風美少女

ベースプロンプト:アニメ風美少女

プロンプト:A vibrant anime-style magical girl with rainbow-colored hair, wearing a futuristic costume with glowing accents, wielding a star-shaped wand, surrounded by floating holographic symbols and sparkles(鮮やかなアニメスタイルの魔法少女で、虹色の髪が特徴です。未来的な衣装を身に纏い、光るアクセントが加えられています。星形の杖を操り、周囲には浮遊するホログラフィックなシンボルとキラキラが散らばっています)

DALL-E 3

Midjourney v6

SDXL

Playground

 全体的に「いかにも」なアニメ美少女のイメージにいちばん近いのはDALL-E 3だろう。Midjourneyはかなりバタくさいことになっている。ソフトな色味の処理はPlaygroundがすぐれているように感じた。SDXLは「虹色の髪」になってないなど少し落ちるかも。

 とはいえ、アニメ系の絵柄を好むStable Diffusionユーザーのほとんどは、そのような画風が出るよう微調整された派生モデルやマージモデルを利用しているのではないだろうか。

Niji v6

 なお、Midjourneyにはアニメやマンガ風のイラストを生成するために特化した「Niji」モデルが用意されている。絵柄もだが、絶対領域をしっかり押さえた躍動感あふれるポーズも「わかってる」感がある。

3.メカ系美少女

ベースプロンプト:ボディーアーマー装着の美少女

プロンプト:A dynamic illustration of a female character in sleek, futuristic body armor with exposed cybernetic parts, wielding an energy sword, standing on a rooftop with a sci-fi cityscape in the background(未来的で洗練されたボディアーマーを身につけた女性キャラクターのダイナミックなイラストで、露出したサイバネティックパーツが特徴です。エネルギーソードを振るい、背景にはサイエンスフィクションの都市景観が広がる屋上に立っています)

DALL-E 3

Midjourney v6

SDXL

Playground

 「ボディアーマー」の表現はPlaygroundがいちばんイメージ通り。DALL-E 3とMidjourneyはボディーアーマーというよりはサイボーグに近い。Midjourneyのあえて背を向けたポーズはかなりかっこいい。SDXLはこの顔になっちゃうこと多いなあ、、、

4.男性キャラ

ベースプロンプト:厨二病要素溢れる男性キャラ

プロンプト:A cool anime-style male character with heterochromatic eyes and a scar, wearing a modern punk-inspired outfit with chains and patches, leaning against a graffiti-covered wall in an alleyway(クールなアニメスタイルの男性キャラクターで、異色症の目と傷が特徴です。モダンなパンク風の服装をしており、チェーンやパッチが付いています。路地のグラフィティで覆われた壁にもたれかかっています)

DALL-E 3

Midjourney v6

SDXL

Playground

 「異色症の目と傷」はわりと微妙だが「チェーンやパッチ」はどれもしっかり出力している。DALL-E 3がいちばん日本のアニメ絵に近いと感じるが、MidjourneyとPlaygroundもそれぞれ独自の雰囲気を出してきている。SDXLのみキャラが少し子供っぽく感じるが背景との調和はしている。

カテゴリートップへ

この連載の記事
ピックアップ