画像生成AI「Stable Diffusion」の代替に?　話題の「FLUX.1」を試した

2024年08月07日 17時00分更新

文● 田口和裕

FLUX.1 [schnell]作品集

　こちらも同様に「過去記事」で使用した他のプロンプトでも生成してみよう。

リアル美少女（アジア系）

ベースプロンプト：20代のリアルな日本人美少女

プロンプト：A photorealistic portrait of a young Japanese woman with long black hair and natural makeup, wearing a casual white blouse, sitting in a modern Tokyo cafe with soft window light（若い日本人女性のフォトリアリスティックな肖像で、長い黒髪とナチュラルメイクが特徴です。カジュアルな白いブラウスを着て、東京のモダンなカフェに座っています。窓からの柔らかい光が彼女を照らしています）

　これは驚きだ。わずか4Stepで描かれたとは思えないフォトリアリスティックな美少女が生成された。もちろん上位モデルと比べると落ちるのだが。

FLUX.1 [schnell]

アニメ風美少女

ベースプロンプト：アニメ風美少女

プロンプト：A vibrant anime-style magical girl with rainbow-colored hair, wearing a futuristic costume with glowing accents, wielding a star-shaped wand, surrounded by floating holographic symbols and sparkles（鮮やかなアニメスタイルの魔法少女で、虹色の髪が特徴です。未来的な衣装を身に纏い、光るアクセントが加えられています。星形の杖を操り、周囲には浮遊するホログラフィックなシンボルとキラキラが散らばっています）

　こちらは[dev]モデルよりもかわいく描けたのではないか。

FLUX.1 [schnell]

メカ系美少女

ベースプロンプト：ボディーアーマー装着の美少女

プロンプト：A dynamic illustration of a female character in sleek, futuristic body armor with exposed cybernetic parts, wielding an energy sword, standing on a rooftop with a sci-fi cityscape in the background（未来的で洗練されたボディアーマーを身につけた女性キャラクターのダイナミックなイラストで、露出したサイバネティックパーツが特徴です。エネルギーソードを振るい、背景にはサイエンスフィクションの都市景観が広がる屋上に立っています）

　こちらも[dev]同様海外アニメ調になっている。指示がない場合実写よりもイラストに近い出力が多く感じる。

FLUX.1 [schnell]

男性キャラ

ベースプロンプト：厨二病要素溢れる男性キャラ

プロンプト：A cool anime-style male character with heterochromatic eyes and a scar, wearing a modern punk-inspired outfit with chains and patches, leaning against a graffiti-covered wall in an alleyway（クールなアニメスタイルの男性キャラクターで、異色症の目と傷が特徴です。モダンなパンク風の服装をしており、チェーンやパッチが付いています。路地のグラフィティで覆われた壁にもたれかかっています）

　こちらも書き込みは少ないが、イラストとしてはばっちり成立している。

FLUX.1 [schnell]

自然風景

ベースプロンプト：自然風景

プロンプト：A breathtaking view of a lush green valley with a winding river, surrounded by mist-covered mountains, with a dramatic sunset sky featuring vibrant oranges and purples（息をのむような美しい緑豊かな渓谷の眺め。蛇行する川があり、霧に包まれた山々に囲まれている。空は劇的な夕日で、鮮やかなオレンジと紫が特徴）

　特に問題なし。この課題はモデル間の差があまり出ない。

FLUX.1 [schnell]

サイバーパンク的風景

ベースプロンプト：サイバーパンクな街並み

プロンプト：A neon-drenched cityscape at night, with towering holographic billboards, flying vehicles zipping between skyscrapers, and crowds of diverse people with cybernetic enhancements walking on elevated walkways（夜のネオンに満ちた都市景観で、高くそびえるホログラフィックな広告板、摩天楼の間を飛び交う飛行車、サイバネティックな強化を施された様々な人々が高架歩道を歩いています。）

　どうもFlux.1は「高架」という言葉をうまく理解できてないようだ。

FLUX.1 [schnell]

不気味な怪物

ベースプロンプト：不気味な怪物

プロンプト：An otherworldly, unsettling creature with multiple shifting eyes, tentacles made of shadow, and a body that seems to defy physical laws, lurking in a dimly lit, fog-filled abandoned warehouse（異界から来たような不穏な生き物で、目が複数ありその位置が変わることがあります。影でできた触手を持ち、物理法則を無視するかのような体をしています。薄暗く、霧が立ち込める廃倉庫に潜んでいます。）

　これもかなりいい。たった4Stepでこんな雰囲気のある画像を生成できるのはすごい。

FLUX.1 [schnell]

派手な料理

ベースプロンプト：派手な料理

プロンプト：A mouthwatering display of colorful and artistic fusion cuisine, featuring a deconstructed sushi burger, molecular gastronomy elements, and creative plating on a sleek black dish with neon accent lighting（カラフルでアーティスティックなフュージョン料理が目を引く展示です。解体された寿司バーガー、分子ガストロノミーの要素、そしてスリークな黒皿にネオンのアクセント照明を使ったクリエイティブな盛り付けが特徴です）

　こちらもばっちりシズル感のある出来。手前の顔はなんなのだろうか……。

FLUX.1 [schnell]

　どれも[dev]と見比べてしまうとほんの少し落ちるが、それでも十分美麗な画像だ。そもそも[schenell]の目指しているところは画像生成というよりは、リアルタイム動画生成だろう。想像してみてほしい、このレベルの画像がリアルタイムでぬるぬる動き出すところを。それはほんの少し先の未来でしかないのだ。

前へ 1 2 3 4 5 6 7 次へ