画像生成AI「Stable Diffusion」の代替に?　話題の「FLUX.1」を試した

2024年08月07日 17時00分更新

文● 田口和裕

FLUX.1 [dev]の実力は？

　せっかくなので、過去記事「人気の画像生成AI、違いは? Stable Diffusion XL、Midjourney、DALL-E、Playgroundの画風を比較する」で使用した他のプロンプトでも生成してみよう。

リアル美少女（アジア系）

ベースプロンプト：20代のリアルな日本人美少女

プロンプト：A photorealistic portrait of a young Japanese woman with long black hair and natural makeup, wearing a casual white blouse, sitting in a modern Tokyo cafe with soft window light（若い日本人女性のフォトリアリスティックな肖像で、長い黒髪とナチュラルメイクが特徴です。カジュアルな白いブラウスを着て、東京のモダンなカフェに座っています。窓からの柔らかい光が彼女を照らしています）

　他のモデルと比べて一番日本人らしい顔に感じた。質感もすばらしく、バリエーションを生成してみたくなる。

FLUX.1 [dev]

アニメ風美少女

ベースプロンプト：アニメ風美少女

プロンプト：A vibrant anime-style magical girl with rainbow-colored hair, wearing a futuristic costume with glowing accents, wielding a star-shaped wand, surrounded by floating holographic symbols and sparkles（鮮やかなアニメスタイルの魔法少女で、虹色の髪が特徴です。未来的な衣装を身に纏い、光るアクセントが加えられています。星形の杖を操り、周囲には浮遊するホログラフィックなシンボルとキラキラが散らばっています）

　こちらはアニメと言うよりアメリカのカートゥーンぽいタッチ。背景もシンプルで他のモデルと比べると圧倒的にキラキラが足りない。

FLUX.1 [dev]

メカ系美少女

ベースプロンプト：ボディーアーマー装着の美少女

プロンプト：A dynamic illustration of a female character in sleek, futuristic body armor with exposed cybernetic parts, wielding an energy sword, standing on a rooftop with a sci-fi cityscape in the background（未来的で洗練されたボディアーマーを身につけた女性キャラクターのダイナミックなイラストで、露出したサイバネティックパーツが特徴です。エネルギーソードを振るい、背景にはサイエンスフィクションの都市景観が広がる屋上に立っています）

　フォト系を出すモデルが多い中、洋アニメ系のタッチになっており新鮮味はある。

FLUX.1 [dev]

男性キャラ

ベースプロンプト：厨二病要素溢れる男性キャラ

プロンプト：A cool anime-style male character with heterochromatic eyes and a scar, wearing a modern punk-inspired outfit with chains and patches, leaning against a graffiti-covered wall in an alleyway（クールなアニメスタイルの男性キャラクターで、異色症の目と傷が特徴です。モダンなパンク風の服装をしており、チェーンやパッチが付いています。路地のグラフィティで覆われた壁にもたれかかっています）

　こちらも他のモデルと比べ、やや子どもっぽい表情になっている。背景のボケ方などはさすがだ。

FLUX.1 [dev]

自然風景

ベースプロンプト：自然風景

プロンプト：A breathtaking view of a lush green valley with a winding river, surrounded by mist-covered mountains, with a dramatic sunset sky featuring vibrant oranges and purples（息をのむような美しい緑豊かな渓谷の眺め。蛇行する川があり、霧に包まれた山々に囲まれている。空は劇的な夕日で、鮮やかなオレンジと紫が特徴）

　平均点だが、Midjourneyと比べると少し落ちる。

FLUX.1 [dev]

サイバーパンク的風景

ベースプロンプト：サイバーパンクな街並み

プロンプト：A neon-drenched cityscape at night, with towering holographic billboards, flying vehicles zipping between skyscrapers, and crowds of diverse people with cybernetic enhancements walking on elevated walkways（夜のネオンに満ちた都市景観で、高くそびえるホログラフィックな広告板、摩天楼の間を飛び交う飛行車、サイバネティックな強化を施された様々な人々が高架歩道を歩いています。）

　少し「高架歩道」が怪しいが、飛行する車やホログラフィックな広告板などよく描けている。

FLUX.1 [dev]

不気味な怪物

ベースプロンプト：不気味な怪物

プロンプト：An otherworldly, unsettling creature with multiple shifting eyes, tentacles made of shadow, and a body that seems to defy physical laws, lurking in a dimly lit, fog-filled abandoned warehouse（異界から来たような不穏な生き物で、目が複数ありその位置が変わることがあります。影でできた触手を持ち、物理法則を無視するかのような体をしています。薄暗く、霧が立ち込める廃倉庫に潜んでいます。）

　他のモデルには無視されがちだった複数の目が描かれており、全体の怪しい雰囲気もよい。

FLUX.1 [dev]

派手な料理

ベースプロンプト：派手な料理

プロンプト：A mouthwatering display of colorful and artistic fusion cuisine, featuring a deconstructed sushi burger, molecular gastronomy elements, and creative plating on a sleek black dish with neon accent lighting（カラフルでアーティスティックなフュージョン料理が目を引く展示です。解体された寿司バーガー、分子ガストロノミーの要素、そしてスリークな黒皿にネオンのアクセント照明を使ったクリエイティブな盛り付けが特徴です）

　個人的に好きなお題。食物はAIが得意とするシズル感の表現をチェックするのに絶好の素材だ。

FLUX.1 [dev]

　なお、大前提として上記の画像はすべて一度しか生成していない、いわゆる「ポン出し」画像だ。何度も生成してその中からいいものを選べば、さらに優れた画像も生成できるだろう。後は根気と工夫だ。

文字入れも得意

　Flux.1は画像内にテキストを入れることも得意だ。特にアルファベットの場合はほぼ成功する。ただし、日本語に関してはなかなか難易度が高いようだ。

プロンプト：stairway to heaven and the clouds in the blue sky gather to form the words: ASCII with a smiley face next to it（天国への階段、青空の雲が集まって文字を作る「ASCII」、横にスマイルマーク。）