画像生成AIの話題を席巻している、Black Forest Labs(BFL)の「FLUX.1」。画像生成AIの新世代モデルとしてコミュニティーの強い支持を集めつつありながら、モデルそのものはVRAMがリッチでないと十分に使えないという条件のため、ユーザーのシフトをにらみ、各社が一斉に公式APIを使ってのFLUX.1へのクラウド対応を進めビジネス化を図ろうとしている印象です。BFLが成功するためには何が重要なのでしょうか。
クラウドサービス化していくFLUX.1
FLUX.1を使った画像生成AIサービスが次々に立ち上がってきています。たとえばその1つがFlux AI Image Generator。FLUX.1の各種モデルで画像生成できるようになっています。面白いのが「Flux AI 画像プロンプトジェネレーター」という機能を備えているところ。「猫」とテキストを入力すると(日本語でも可)、そこからプロンプトを膨らませて複雑なプロンプトを作ってくれます。FLUX.1は複雑な文章のプロンプトを認識してくれるのが特徴的なのですが、その作文は逆に言うと面倒でもあるのです。このイメージを膨らませるプロセスは、ChatGPTなどのLLMでもできることなのですが、お手軽な点が強みです。
プロンプトの生成費用は無料なのですが、そのプロンプトを使って、すぐ画像が作れるようになっています。プロンプト生成は無料で提供して、サービスとして継続して使ってもらうという誘引策にしているというわけですね。
月額19.99ドルのベーシックプランでは1500クレジットが与えられ、高速版の「schnell」モデルだと1クレジット、上位版の「dev」モデルだと10クレジット、最上位の「pro」だと20クレジットという値付けがされています。この値段の違いは、FLUX.1の公式のAPIの使用料を含んでいるのだと思います。
schnellはウェイトモデルが公開されており、商用利用も自由に可能です。devはウェイトモデルが公開されていますが、商用サービスでは利用は不可というライセンスで、BFLが提携しているパートナー経由でAPIを使えばサービスに組み込むことは認められています。1回のAPI利用料はschnellが0.003ドル、devが0.025~0.03ドル、proが0.05~0.055ドルですが、特に上位モデルの生成費用が高めに設定されており、費用分が上乗せされた形になっています。このサービスの場合、1クレジットは0.013ドルに相当するため、devで生成した場合、0.13ドルかかるという計算になります。
また、1回あたりの生成には20クレジットが必要になるものの、dev用の絵柄LoRAも用意されており、選択するだけで、それ風の画像が出せるというサービスも行っています。このサービスは、FLUX.1に集中してサービスを広げようとしているところに特徴があります。
FLUXにも力を入れはじめたCivitAI
コミュニティーに強い画像生成AIクラウドサービスのCivitAIも、FLUX.1 devを使えるようにしています。schnellもproも選択肢にあるのですが、なぜか選ぶことができません(9月8日現在)。devの1枚あたりの生成費用は33Buzz(0.33ドルに相当)、LoRAを組み合わせた場合は44Buzzに設定されています。これまでのStable Diffusion XLのモデルの場合は5Buzzでした。やはりFlux.1の画像生成にはAPIを利用していると考えられ、以前に比べると割高な価格設定になっています。
それでも、CivitAIはFLUX.1の普及に力を入れはじめています。CivitAIの強みは、同サイトにアップロードされているユーザーのLoRAを組み合わせてクラウドで画像を生成する事ができる点です。前回紹介した、クラウドでの1回2ドルのLoRAトレーニングサービスの普及を目的とした「Fluxトレーニングコンテスト」は、8月21日~9月6日の間に、1000近いLoRAの投稿をユーザーから集め大きく成功したと言えそうです。
FLUX.1はとにかくウェイトモデルのファイルサイズが22GBと大きく、量子化(省サイズ化)をユーザーが進めたこともあり、ローカルPCにも広がりはじめています。それでも、VRAMが12GB程度は必要で、NVIDIA GeForce RTX 4090(VRAM 24GB)でも1枚あたり30秒近く生成にかかります。VRAMが小さく速度が遅いPCだと、1枚生成するのに数分間かかるというのが当たり前です。そのため、高性能なPCで安定的な速度で品質を保てるクラウドサービスを求めるユーザーがこれまで以上に出てくるという予想があるのでしょう。
技術の入れ替わり期には支持されるサービスが切り替わることもよくあるため、多くの会社がチャンスとみなしているのは間違いないでしょう。少なくとも、BFLが選択したAPIを通じた課金方式を多くのクラウドサービス企業が受け入れはじめています。ユーザーが受け入れるかどうかはまだ見極めきれませんが、周辺のサービスを充実させることでユーザーの支持を得ようという動きは、今後も進んでいくでしょう。
この連載の記事
-
第87回
AI
画像生成AIの進化が早すぎる 2024年に起きたことまとめ -
第86回
AI
イラストに強すぎる画像生成AIモデル SDXL系「NoobAI-XL」の衝撃 -
第85回
AI
3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 -
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? - この連載の一覧へ