このページの本文へ

無料で使える画像生成AIの定番は「Stable Diffusion」ではなくなるかもしれない

2024年06月27日 14時30分更新

文● 田口和裕

  • この記事をはてなブックマークに追加
  • 本文印刷

 Invoke、Comfy Org、Civitai、LAIONは6月25日、米コミュニティーサイト「Reddit」の「r/StableDiffusion」スレッドで、画像・動画・音声生成のためのオープンライセンスAIモデルの開発を推進することを目的にしたプロジェクト「Open Model Initiative」の立ち上げを宣言した。

企業による技術の独占を防ぎ、アクセシビリティを確保

 「Open Model Initiative」の初期メンバーは、企業向け生成AIプラットフォームを提供するInvoke、直感的に操作できるオープンソースの画像生成AIツール「ComfyUI」を開発するComfy Org、クリエイター向け生成AIモデル共有サイトを運営するCivitai、大規模な学習データセットを構築するLAIONだ。

 彼らは、最近の制限的ライセンス下でのAIモデルのリリースに懸念を示し、オープンソースの活動を通じて、大企業によるこれらの技術の独占を防ぎ、アクセシビリティを確保することを目指している。

 発表の背景には、Stable Diffusionの開発元であるStability AIが最近リリースした「Stable Diffusion 3(SD3)」をめぐる論争がある。

 SD3は、月額20米ドル(およそ3200円)の利用料と月間6000枚という生成上限を設けるなど、制限的なライセンス条項を含んでいる。

 さらに、SD3で生成された画像を学習データに含むモデルにまで、Stability AIが過度な権利を主張しているとの指摘もある。これを受けてCivitAIはSD3ベースのモデルを一時的に禁止する措置を取った。

 「Open Model Initiative」では、こうした状況を踏まえ、開発者・研究者・組織の協力体制を整えオープンソースのAIモデル開発を加速させる方針だ。具体的には、ガバナンス体制の確立、コミュニティの要望を反映した研究開発、モデル間の相互運用性向上のための標準化などに取り組む計画だ。

 Stable Diffusionに関心をもつ開発者たちが集うr/StableDiffusionでの発表は、「Open Model Initiative」が企業ではなくコミュニティ主導のプロジェクトであることを象徴している。

 コミュニティ主導のオープンソース画像生成AIはStable Diffusionの代替になるのだろうか。動向を注目していきたい。

カテゴリートップへ

ピックアップ