独Black Forest Labs(BFL)は11月25日、画像生成AIモデル「FLUX.1」の正統後継となる「FLUX.2」を発表した。プロフェッショナルな実務ワークフローに組み込むためのインフラとして設計されている点が特徴だ。
技術的には、Mistral-3ビジョン言語モデル(240億パラメーター)と、Rectified Flow(RF)Transformerを組み合わせた新たなアーキテクチャーが特徴。これにより、物理法則や空間的な整合性、材質の表現力が飛躍的に向上している。
特に注目すべきは、最大10枚までの参照画像を同時に読み込み、キャラクターや製品の一貫性を維持したまま新しい画像を生成できる「マルチリファレンス機能」だ。
最大4メガピクセルの高解像度での画像編集も可能で、複雑なタイポグラフィやロゴ、インフォグラフィック内の文字情報も崩れることなく正確に描写する能力を持つ。
ラインナップは用途ごとに4種類を用意する。
最高品質を誇るAPI専用の「FLUX.2 [pro]」、ステップ数などを細かく制御できる開発者向けの「FLUX.2 [flex]」、非商用利用が可能でHugging Faceでウェイトが公開される320億パラメーターの「FLUX.2 [dev]」、そして近日公開予定の軽量な蒸留モデル「FLUX.2 [klein]」だ。
なかでも、[dev]のFP8量子化モデルはNVIDIAおよびComfyUIとの共同制作によって最適化されており、一般消費者向けのGPUでもローカル動作が可能だ。ただしドキュメントによれば4ビット量子化版でも動作にRTX 4090(24GB)などを必要としており、仕様上のハードルは高い。
AI業界では、競合Google DeepMindが「Nano Banana Pro(Gemini 3 Pro Image)」を発表したばかり。Nano Banana ProはGoogle検索とのリアルタイム連携や最大14枚の参照画像読み込み、4K解像度への対応を強みとして、スペック面ではFLUX.2を凌駕する部分もある。
一方のFLUXは「オープンコア」の理念を掲げ、高性能なモデルをオープンウェイトとしてコミュニティに開放する戦略でGoogleに対抗する。クローズドで攻める巨人Googleと、オープンコミュニティで対抗するFLUXの戦いが始まった。







