複雑とシンプル オープンに繰り返されるカウンター
StabilityAIは、SDXLリリース後、展開の再編に入っています。初心者向けツールは「Clipdrop」というクラウド型サービスへと集約化を進め、基本無料の月額課金型サービスへと展開を進めています。
一方、アプリの側は、ComfyUIの開発者のcomfyanonymous氏を雇用し、ComfyUIと同社のStableSwarmUIの統合を進めています。開発環境としては専門知識を要求する複雑な環境へと発展していますが、カスタマイズ性に優れ、複雑なワークフロー設計ができることからエンジニアに強くアピールする内容になっています。同社の環境を基本としたContorlNetに近い機能「Control-LoRAs」を発表するなど、高機能化によって差別化をはかるとともに、これらをClipdropのAPIに統合することで、開発者の支持を得ようとしています。
StabilityAIが発表した「Control-LoRAs」の線画抽出機能「Canny」。ComfyUIでサンプルのワークフローを動作させている様子。左下で入力した画像が、線が抽出され、右側の画像になって出力される
Fooocusは、こうした複雑化していく画像生成AIの環境そのものへの強烈なカウンターになり、初心者には難しいと考えられていたSDXLのハードルを一気に引き下げました。「画像にメタデータを入れるのが当たり前」と思われていた大手の考え方に対するカウンターにもなっています。さらに、Fooocus自身もFooocus-MREのようなカウンターも受けて発展していく。こうした意外な成長の仕方をしていくのもオープンソースコミュニティの強みであり、とてつもなくイノベーションが早い理由になっているように感じます。
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第160回
AI
寝不足になるほど面白い ローカルAIと音声合成をつないだら、キャラが普通にしゃべり始めた -
第159回
AI
AIを使える人と使えない人で、とんでもない差が出ると実感した理由 -
第158回
AI
SDXLの次はこれ? アニメ特化のローカル画像生成AI、驚きの実力 -
第157回
AI
AIだけでゲームは作れるのか? Codexに7本作らせて見えた実力と限界 -
第156回
AI
ChatGPTの画像生成AIは本当に最強か Nano Bananaと比べて見えた“弱点” -
第155回
AI
非エンジニアが数百万円級のツールを開発 画像&動画生成AIツールがゼロから作れた話 -
第154回
AI
ChatGPTの画像生成AIが強すぎる AI画像が世界中に氾濫する時代へ -
第153回
AI
ChatGPTの画像生成AIが「Nano Banana」超え? 漫画や動画風カットが実用レベルに -
第152回
AI
Seedance 2.0×AIエージェントでAI動画が激変 “AI脚本家”や“AI絵コンテ作家”との共同作業で、アニメ制作が身近に -
第151回
AI
画像・動画生成AIの常識が変わる、Claude Codeに全部やらせる方法論 -
第150回
AI
無料でここまで? 動画生成AI「LTX-2.3」はWan2.2の牙城を崩すか - この連載の一覧へ






