Stable Diffusion入門 from Thailand 第23回
最新の画像生成AI「FLUX1.1 [pro]」違いは? Midjourney、DALL-E、Imagen 3、Stable Image Ultraと比較
2024年10月18日 17時00分更新
短いプロンプト
Flux 1.1 [pro]には、ユーザーのプロンプトをより詳細なプロンプトに自動的に拡張する「アップサンプリング」機能があるため、短いプロンプトでも創造的な画像を生成できるという。
その例として「Vintage photography(古い写真)」というキーワードを頭に入れるというテクニックが紹介されていたので試してみることにしよう。プロンプトは以下。
プロンプト:Vintage photography. A woman combing her hair next to a ghost.(ビンテージフォト。幽霊の隣で髪をとかす女性)
1.1 [pro]にこのプロンプトを入れて生成すると、内部的には以下のようなプロンプトに拡張されて生成される。
プロンプト:A black-and-white vintage photograph of a Caucasian woman with shoulder-length blonde hair, sitting at a vanity, combing her hair, while a ghost of a Victorian gentleman in a waistcoat stands beside her, looking towards the mirror.(肩まで伸ばしたブロンドヘアの白人女性が化粧台に座り、髪をとかしている様子を写したモノクロのヴィンテージ写真。彼女の横には、ベストを着たビクトリア朝の紳士の亡霊が立っており、鏡の方を向いている。)
まるで映画のワンシーンのような雰囲気のある画像が生成された。ただ、「A black-and-white vintage photograph(モノクロのビンテージフォト)」というプロンプトが無視されているのは気になる。
こちらは1 [pro]の画像。1.1 [pro]のようなプロンプトの拡張は行われていないがくすんだ色合いのムードある画像になっている。ただしこちらもビンテージフォト要素は少ない。
Midjourneyはばっちりビンテージフォトの雰囲気を出してきているが、お嬢さんが幽霊の口にブラシを突っ込んでいるという謎のシチュエーションになっている。
DALL-E 3はビンテージフォトというよりはセピア色で描かれた絵という感じだ。女性が幽霊に髪をとかされているのはこれだけ。
Imagine 3はホーンテッドハウス感あふれる半透明の幽霊がよい。クシをもってても髪をとかしてはいないが。
ビンテージフォトの表現はStable Image Ultraがベスト。女性の顔が髪の毛などによって壊れているのは惜しいが、かえって不条理アートにも見えてくるところがおもしろい。
1.1 [pro]の独自性も捨てがたいが、個人的好みで言えばベストはStable Image Ultra。

この連載の記事
-
第35回
AI
ここがヤバい!「Nano Banana Pro」画像編集AIのステージを引き上げた6つの進化点 -
第34回
AI
無料で始める画像生成AI 人気モデルとツールまとめ【2025年11月最新版】 -
第33回
AI
初心者でも簡単!「Sora 2」で“プロ級動画”を作るコツ -
第32回
AI
【無料】動画生成AI「Wan2.2」の使い方 ComfyUI設定、簡単インストール方法まとめ -
第31回
AI
“残念じゃない美少女イラスト”ができた! お絵描きAIツール4選【アニメ絵にも対応】 -
第30回
AI
画像生成AI「Midjourney」動画生成のやり方は超簡単! -
第29回
AI
創作のプロセスを激変させる画像生成AI「Midjourney V7」の使い方 ドラフトモード、パーソナライズ機能に大注目 -
第28回
AI
ローカル動画生成AIの革命児「FramePack」の使い方 -
第27回
AI
【解説】Geminiの画像生成がすごい 無料で使えるうちに試してみて -
第26回
AI
人気の画像生成AIツール「ComfyUI」デスクトップアプリがめっちゃラク 初心者にオススメ -
第25回
AI
業界トップ級の画像生成AIツール「Recraft」 Adobeユーザーは体験する価値あり - この連載の一覧へ











