話題の画像生成AI「FLUX.1」　人気サービス「Midjourney」との違いは

2024年09月09日 07時00分更新

文● 新清士　編集●ASCII

棲み分けられるMidjourneyとFLUX.1

　こうしてFLUX.1がクラウドサービスとして広がりつつあることもあり、画像生成AIの有償クラウドサービスとして最も成功していると推測されているMidjourneyの対抗馬として見られつつあります。実際、FLUX.1が登場したときも、FLUX.1自体も発表時にプロンプトへの追従度は、Midjourneyよりも高いということをアピールしたため、特に英語圏ではしきりにMidjourneyと性能が比較されていました。

　ただ、ここ1ヵ月使ってきた感想としては、画像単体の魅力はMidjourneyの方が高いように感じられます。Midjourneyは品質を引き上げるために、ユーザーに対しても2枚の画像を見せてどちらの方がより品質が高いか比べる評価テストを積極的に実施しており、人間が評価する絵を追求してきたことで、一日の長があります。学習量もサービス開始からの約2年間で相当進んでいると思われるため、簡単にFLUX.1が品質面でも抜き去り、ユーザーを奪うという状況にはならないと考えられます。

　Midjourneyのスタンダードプランは月30ドルで、15時間分の計算時間の利用料という形式です。1枚あたりのコストという形ではないため、Flux.1と比較しにくい点もあります。ただ、スタンダードプランの場合、15時間使い切っても「リラックスモード」という生成速度が遅いモードで生成できるため、実質的には無制限で利用できる点が強みです。このあたりの料金体系の違いも選ばれる際に検討される要素になるのではないでしょうか。

同じプロンプトで生成した2枚。左がMidjourney、右がFlux.1 dev。どちらも迫力ある画像だが、絵としての魅力はMidjourneyの方が上のように見える。Midjourneyのプロンプトはユーザーが公開しているものを参考にし、自然文になっていないのでFlux.1 dev用のプロンプトはその画像をFlux AI Image Generatorの「Flux AI画像からプロンプト生成器」を利用して自然な文章を生成している

　プロンプトだけで、FLUX.1 devでMidjourneyに匹敵するような画像を出すには、現在のベースモデルはファインチューニングの量が不足しているように感じます。「Stable Diffusion XL」はリリースされてから半年余り後に、コミュニティーによってファインチューニングされた「AnimagineXL」や「Pony Diffusion XL」が登場して、公式モデルでは出せなかったレベルの品質が出せるようになりました。これはそもそものモデルの潜在空間（Latent space）にそれだけの表現力が潜んでいるからこそ、ファインチューニングによって引き出すことに成功したのです。FLUX.1 devはそうした高品質なファインチューニングモデルを作るための模索作業が続いています。

　ただし一方で、FLUX.1には「Image 2 Image（i2i）」が使えるという大きな強みがあります。まだFLUX.1のクラウドサービスで対応しているところは少ないようですが、Midjourneyにはこの機能がないので大きな強みになります。今でも、FLUX.1の潜在空間の片鱗を見ることができるのがi2iなのです。Midjourneyで生成された情報量の多い画像を利用してi2iを作成することで、プロンプトだけでは作成できない複雑な画像を作り出すことができます。

　例として、Midjourneyで生成した画像を利用して、FLUX.1 devで、複数のLoRAを組み合わせることでコントロールした画像を紹介します。複数の画像を組み合わせて、なじませた画像を作り出すことも得意です。Midjourneyで作成した虎の絵に、レタッチして、虎に乗っているように見える女性を合成しました。足なども適当に描き足しています。これを、FLUX.1 devのi2iに入れて生成するだけで、虎の上に女性が乗っている画像ができあがるのです。

Web UI ForgeでのFLUX.1 devのi2i作成例。Photoshopで虎と明日来子さんの2枚の画像を組み合わせて、右側の画像を作成し、その画像を解析しプロンプトを作成し、さらに画像に合わせて修正。筆者が独自作成したLoRAなどを組み合わせ、強度は0.5程度で作成

　元の絵の形状を保ったまま、豪華にしたり、アニメ風にしたりもできます。変化の強度設定を変えたり、少し工夫を加えるだけで、絵の情報量をコントロールできます。

前述の画像を使って、先週紹介したファインチューニングモデルのFluximationでi2iをして、よりイラスト的な雰囲気を強調したもの（左）、NovelAIの線画機能を使い線画にした後に、再度i2iを掛けて精緻化したもの（右）

　Midjourneyの画像をよりアニメ風にしたり、バリエーションを作るのに、FLUX.1 devの表現力は非常に効果的なのです。Stable Diffusion XLのi2iでも同様のことができるのですが、ここまで精緻に画像の整合性を取ることはできませんでした。

　表現できる画像の画風は、そのウェイトモデルの潜在空間の持つ可能性です。将来的にFLUX.1のファインチューニングモデルの登場によって、さらに様々な表現が実現され、性能が上がっていくことをはっきりと示唆しています。

前へ 1 2 3 次へ

ツイートする

カテゴリートップへ

AI

話題の画像生成AI「FLUX.1」　人気サービス「Midjourney」との違いは

棲み分けられるMidjourneyとFLUX.1

この連載の記事

AI
画像生成AI「Stable Diffusion」の代替に?　話題の「FLUX.1」を試した

AI
話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす（高速化も試してみました）

AI
「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」

AI
画像生成AI「FLUX.1」が相当ヤバい　LoRAで画風の再現も簡単に

AI
AIが考える“アイドル”がリアルすぎた　グーグル「Imagen 3」なぜ高品質?

AIオススメ記事

動画生成AI、ついにアダルトの扉が開く

月3万円で使えるOpenAIの「Deep Research」　驚異的だが、情報格差が広がる不安も感じた

AIの書いた小説が普通に面白い　ChatGPT「o1」驚きの文章力

グーグルAI「Gemini」　無料版と有料版の使い方を徹底解説

ChatGPT超えの中国AI「DeepSeek-R1」の衝撃

OpenAI、最新AIモデル「o3 mini」無料開放　「o1」超えるつよつよ性能

まだ遅くないAI学習　無償の学習基盤を日本マイクロソフトが公開

火中の栗「DeepSeek」を拾うマイクロソフトの脊髄反射がすごい

完全無料！話題のDeepSeek R1をローカルで動かしてみた。MacやスマホでもOK！

「DeepSeek」コード内にユーザーデータを中国政府に送信する機能か　米メディア報道

ピックアップ

クラウド時代に選ばれるデータセンターへ　オプテージ「曽根崎データセンター」はネットワークへの接続性が強み

ホワイトゲーミングPCに高機能なホワイトディスプレーを組み合わせたら神環境になった話

1人情シスのみなさんに代わって、AmazonでSKYSEAを買ってみました

【めちゃ綺麗！】サムスンディスプレイ製量子ドット有機ELパネルがスゴイ32:9ディスプレー、発色・色再現性よくゲームに役立つ機能も豊富！

サムスンディスプレイ製QD-OLEDパネルは何がスゴイ？ポイントは白なしRGBのみで色を再現している点

オープンイヤー型で耳を塞がないのが快適！耳掛けイヤホンの新定番になりそう！「HUAWEI FreeArc」レビュー

AMD RyzenでゲーミングPC自作するのに「ちょうどよい」チップセット、性能、拡張性、価格のB850マザーボードとは

チーズが口の中であふれる！ケンタッキーの「チーズにおぼれるフィレバーガー」はチーズ好きも納得の濃厚な食べごたえがスゴい！

1kg切って14時間駆動でCore Ultraシリーズ2搭載で良コスパ、AIに強いノートPCを見つけた

35万円超NAS、Thunberbolt 4＆10GbEでPCとつないだら神速すぎ！ 18.2GBを7秒でコピー

実は超レアな23.8型4Kディスプレー、USB Type-C給電・KVM・昇降式多機能スタンドで約4.2万円はコスパ激強

雪山みたいな白銀の美しさ、白で統一したゲーミングPC自作でハイエンドを目指すためのZ890マザーボード

イトーキが考える「進化し続けるオフィス」、それを支えるネットギア「M4350」スイッチ

約986gの衝撃、切れ味鋭いエッジが光る「AI時代のThinkPad」―今売れているThinkPad X1 Carbon Gen 13 Aura Editionをひも解く

あなたの会社でも起こりうる“SD-WANのセキュリティ設定漏れ”、どうやったら防げた？

Backlogに社外メンバーを招待する際のリスクと“安全な設定方法”とは？

企業やSIerが“付き合いやすいColt”へ、大江代表に聞く2025年の成長戦略

生成AIの次なるステージ：ローカル環境がビジネスの新しい扉を開く理由

ビデオカードなしで｢FFXIV: 黄金のレガシー｣の60fps超えが狙える!? 「AMD Ryzen 5 8600G」の実力を見た！

話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは

棲み分けられるMidjourneyとFLUX.1

この連載の記事

この記事の編集者は以下の記事をオススメしています

AI 画像生成AI「Stable Diffusion」の代替に? 話題の「FLUX.1」を試した

AI 話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす（高速化も試してみました）

AI 「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」

AI 画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に

AI AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質?

AIオススメ記事

ピックアップ

話題の画像生成AI「FLUX.1」　人気サービス「Midjourney」との違いは

AI
画像生成AI「Stable Diffusion」の代替に?　話題の「FLUX.1」を試した

AI
話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす（高速化も試してみました）

AI
「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」

AI
画像生成AI「FLUX.1」が相当ヤバい　LoRAで画風の再現も簡単に

AI
AIが考える“アイドル”がリアルすぎた　グーグル「Imagen 3」なぜ高品質?