このページの本文へ

新清士の「メタバース・プレゼンス」 第76回

「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」

2024年08月19日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

「Stable Diffusion」の失敗に学んだライセンスモデル

 BFLは、Stability AIの失敗からかなり学んで戦略を展開しているようです。結果的にStability AIの大きな失敗となったのは、基幹モデルのStable Diffusionを誰でも無料で使えるという条件で出してきたことです。一部のユーザーはStablity AIが用意する有料クラウドサービスを利用すると想定していたのですが、実際には、他社が同様のクラウドサービスをより迅速に展開したことで、期待したほどの収益を上げられない環境が作り出されてしまいました。

 Flux.1は、同じ轍を踏まないようにライセンスに仕掛けを施しています。

 ProモデルはAPIを通じてしか利用できず、その値段も高コストです。モデルが入手できるschnellは無料で商用利用も可能です。実際に、日本でもクラウドサービスを展開するAkuma.aiは6日にいち早く対応しており、一度の生成で同じプロンプトで4枚生成できる機能を実装しました。他にもクラウドサービスがschnellモデルを採用するケースは増えてきています。Flux.1の知名度を獲得するために、入門版として積極的に採用を認めているようにも見えます。

 しかし、schnellモデルには弱点があります。リリース後、ユーザーコミュニティーによって続けられている解析によれば、追加学習やControlNetやLoRAが機能しにくいモデルになっているようです。一方で、性能の高いdevモデルはControlNetやLoRAの開発環境の整備がユーザーにより進められており、ユーザーコミュニティーで人気を得るモデルはdevモデルということになりそうです。

 しかし、devモデル自体は「非商用モデル」です。ライセンスの規約によると「モデルそのものや、その修正版(カスタマイズ版や微調整版を含む)や派生物は商用目的では利用できません」。ここでいう派生物には、devモデル用の追加学習モデルやLoRAなどが含まれると考えられます。さらに非常に重要な点として「(BFLは)アウトプットに対する所有権を主張しない」のです。生成された画像については、「ユーザーが責任を負わなければならない」とするものの、「いかなる目的(商業目的を含む)にもアウトプットを使用することができます」としています。つまり、企業はdevモデルを利用して、今までのように無料で画像生成AIのクラウドサービスを展開できないが、ユーザーは出力結果を自由に利用できるというわけです。

 これらの条件を考慮すると、高性能なdevモデルをユーザーが支持し、草の根の技術開発が進む可能性は高いと考えられます。一方で、それを企業が事業として利用する場合には、BFLと商用ライセンスを結ぶ必要があるという、よく考えられた戦略になっています。

CivitAIにはすでに多数のFluxの派生モデルが登場し始めている

 例えば、CivitAIは、これまでのStable Diffusionが自由なライセンスなのを利用して、ユーザーの派生物データによってビジネスを作ってきたサービスです。公開されているモデル等をクラウドで利用する際に、利用ユーザーに課金が掛かる仕組みになっており、作成したユーザーも換金可能なポイントがもらえる仕組みです。そして、SD3に対しては、規約の曖昧さから、派生物の投稿を拒否し、最終的にStablity AIを折れさせ、規約を有利に変えさせるまでの影響力を持つまでになりました(参照:危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ)。

 しかし、Flux.1については条件を変えざるをえません。schnellについてはサイト内でもクラウドを生成できるようになっていますが、devモデルでは同じことができないためです。dev中心でFluxコミュニティが発達するにつれて、BFLと何らかの商用ライセンスを結ぶ必要性に迫られるのではないでしょうか。

 ただし、ユーザーによりschnellモデルを使った技術開発も並行して進められているため、まだどちらが主流になるのかは、決定的にはなっていないので、まだわからない状況ではありますが。

カテゴリートップへ

この連載の記事
ピックアップ