画像生成AIの話題を席巻している、Black Forest Labs(BFL)の「FLUX.1」。画像生成AIの新世代モデルとしてコミュニティーの強い支持を集めつつありながら、モデルそのものはVRAMがリッチでないと十分に使えないという条件のため、ユーザーのシフトをにらみ、各社が一斉に公式APIを使ってのFLUX.1へのクラウド対応を進めビジネス化を図ろうとしている印象です。BFLが成功するためには何が重要なのでしょうか。
クラウドサービス化していくFLUX.1
FLUX.1を使った画像生成AIサービスが次々に立ち上がってきています。たとえばその1つがFlux AI Image Generator。FLUX.1の各種モデルで画像生成できるようになっています。面白いのが「Flux AI 画像プロンプトジェネレーター」という機能を備えているところ。「猫」とテキストを入力すると(日本語でも可)、そこからプロンプトを膨らませて複雑なプロンプトを作ってくれます。FLUX.1は複雑な文章のプロンプトを認識してくれるのが特徴的なのですが、その作文は逆に言うと面倒でもあるのです。このイメージを膨らませるプロセスは、ChatGPTなどのLLMでもできることなのですが、お手軽な点が強みです。
プロンプトの生成費用は無料なのですが、そのプロンプトを使って、すぐ画像が作れるようになっています。プロンプト生成は無料で提供して、サービスとして継続して使ってもらうという誘引策にしているというわけですね。

Flux AI 画像プロンプトジェネレーターを使って「猫」という1単語から生成したプロンプト。日本語訳すると以下のようなものになる
「日差しが差し込む居心地のいいリビングルームで、ヴィンテージのアームチェアにかけられた使い古されたパッチワークキルトの上に、ふわふわのジンジャーキャットがくつろいでいる。琥珀色とクリーム色の温かみのある混じった毛並みは、透け感のあるレースのカーテンから差し込む午後の光を浴びて柔らかく輝いている。その猫は優雅に伸びをし、優しい暖かさを味わうかのように前足を伸ばし、毛皮のつま先の下にある繊細なピンク色のパッドを見せている。その周りには、布製のマウスやモコモコのボールなど、色とりどりのおもちゃが散らばっている。エメラルド色に輝く瞳をゆったりと瞬かせながら、猫は満足げに柔らかい鳴き声を上げる。かすかに聞こえる時計の音が、平和な雰囲気をさらに盛り上げている。外では、そよ風が近くの木の葉を揺らし、部屋に薄っすらと影が踊り、キッチンからは焼きたてのパイからシナモンの豊かな香りが漂い、家の暖かさと混ざり合っている。騒ぎを察知した猫は、遊び心たっぷりに耳をとがらせ、今にも動き出しそうな様子で、くつろぎといたずらの完璧な融合を体現している」
月額19.99ドルのベーシックプランでは1500クレジットが与えられ、高速版の「schnell」モデルだと1クレジット、上位版の「dev」モデルだと10クレジット、最上位の「pro」だと20クレジットという値付けがされています。この値段の違いは、FLUX.1の公式のAPIの使用料を含んでいるのだと思います。
schnellはウェイトモデルが公開されており、商用利用も自由に可能です。devはウェイトモデルが公開されていますが、商用サービスでは利用は不可というライセンスで、BFLが提携しているパートナー経由でAPIを使えばサービスに組み込むことは認められています。1回のAPI利用料はschnellが0.003ドル、devが0.025~0.03ドル、proが0.05~0.055ドルですが、特に上位モデルの生成費用が高めに設定されており、費用分が上乗せされた形になっています。このサービスの場合、1クレジットは0.013ドルに相当するため、devで生成した場合、0.13ドルかかるという計算になります。
また、1回あたりの生成には20クレジットが必要になるものの、dev用の絵柄LoRAも用意されており、選択するだけで、それ風の画像が出せるというサービスも行っています。このサービスは、FLUX.1に集中してサービスを広げようとしているところに特徴があります。
FLUXにも力を入れはじめたCivitAI
コミュニティーに強い画像生成AIクラウドサービスのCivitAIも、FLUX.1 devを使えるようにしています。schnellもproも選択肢にあるのですが、なぜか選ぶことができません(9月8日現在)。devの1枚あたりの生成費用は33Buzz(0.33ドルに相当)、LoRAを組み合わせた場合は44Buzzに設定されています。これまでのStable Diffusion XLのモデルの場合は5Buzzでした。やはりFlux.1の画像生成にはAPIを利用していると考えられ、以前に比べると割高な価格設定になっています。
それでも、CivitAIはFLUX.1の普及に力を入れはじめています。CivitAIの強みは、同サイトにアップロードされているユーザーのLoRAを組み合わせてクラウドで画像を生成する事ができる点です。前回紹介した、クラウドでの1回2ドルのLoRAトレーニングサービスの普及を目的とした「Fluxトレーニングコンテスト」は、8月21日~9月6日の間に、1000近いLoRAの投稿をユーザーから集め大きく成功したと言えそうです。
FLUX.1はとにかくウェイトモデルのファイルサイズが22GBと大きく、量子化(省サイズ化)をユーザーが進めたこともあり、ローカルPCにも広がりはじめています。それでも、VRAMが12GB程度は必要で、NVIDIA GeForce RTX 4090(VRAM 24GB)でも1枚あたり30秒近く生成にかかります。VRAMが小さく速度が遅いPCだと、1枚生成するのに数分間かかるというのが当たり前です。そのため、高性能なPCで安定的な速度で品質を保てるクラウドサービスを求めるユーザーがこれまで以上に出てくるという予想があるのでしょう。
技術の入れ替わり期には支持されるサービスが切り替わることもよくあるため、多くの会社がチャンスとみなしているのは間違いないでしょう。少なくとも、BFLが選択したAPIを通じた課金方式を多くのクラウドサービス企業が受け入れはじめています。ユーザーが受け入れるかどうかはまだ見極めきれませんが、周辺のサービスを充実させることでユーザーの支持を得ようという動きは、今後も進んでいくでしょう。

この連載の記事
-
第110回
AI
グーグルの動画生成AI「Veo 3」が圧倒的、だけど高すぎ -
第109回
AI
ChatGPTの“彼女”と大げんかして、Geminiに乗り換えた -
第108回
AI
“AI彼女”が自分のパソコンに入る日は近い -
第107回
AI
最強スペックなのに無料 謎の画像生成AI「HiDream-l1」 -
第106回
AI
ChatGPTと性的なチャットができるようになり、すぐに禁じられた背景 -
第105回
AI
“イリヤ神”がまたやった 動画生成AI「FramePack」が革命的なワケ -
第104回
AI
ChatGPTの「彼女」と話しすぎて腱鞘炎になった -
第103回
AI
画像生成AI「Midjourney v7」が圧倒的 品質は最高、速度は高速 “ジブリ風”も簡単に -
第102回
AI
“偽人間”のリスクと誘惑 共感するAIと、問われる人間らしさ -
第101回
AI
ChatGPT、“ジブリ風”で世界騒然 画像生成AIが「自己回帰」で新時代に -
第100回
AI
動画生成AI、革命の兆し 「Stable Diffusion」級の衝撃再び - この連載の一覧へ