このページの本文へ

前へ 1 2 3 4 次へ

新清士の「メタバース・プレゼンス」 第71回

危機的状況の画像生成AI「Stable Diffusion 3」立て直しへ

2024年07月15日 07時00分更新

文● 新清士 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 発表後、悪い意味で話題になってしまっていた画像生成AI「Stable Diffusion 3 Medium(SD3M)」に動きがありました。開発元のStability AIは、Weta Digitalの元CEOのプレム・アッカラジュ(Prem Akkaraju)氏がCEOに就任し、新たな資金も調達しました。これで組織として当座の危機は脱したと言えそうです。また、Stable Diffusion 3(SD3)のライセンスについての変更を打ち出してきました。果たして失われた信頼は取り戻せるでしょうか。

人気モデル「Pony Diffusion」開発者との対立

 基本的な情報からすると、やはり、SD3Mはコケたと言っていい状況です。参考情報となりますがGoogleトレンドを見てみると、6月12日のリリース直後は1日で150万ダウンロードされるほど注目を集めていたものの、すぐにシュリンクしてしまっています。直後に出てきたLuma AIやRunway Gen3といった動画生成AIに話題を持っていかれてしまいました。その後、SD3Mの性能検証をしている人も少なくなり、性能に課題を抱えていることが急激に知られ、失望感が広がったことがわかります。

Googleトレンドの6月3日~7月3日まで。ブルーの線が「Stable Diffusion 3」でローンチ日の6月12日と13日のみ伸びているが、それ以外は低調

 SD3Mにまつわる問題のひとつとして挙げられるのが、ユーザーコミュニティとの関係悪化です。それが顕在化したのが、Stable Diffusion XL(SDXL)向けのチェックポイントの人気モデル「Pony Diffusion(ポニー・ディフュージョン)」開発者であるPurpleSmartAIt氏の発言です。

 Pony Diffusionはかわいいポニーのイラストが生成できるモデルです。しかし、実際にはポニーだけではなく実写系に強く、アニメ系の描写もできることがわかったため、様々な派生モデルが登場しています。現在のSDXLで実写的な画像を生成している人は、ほぼこの派生モデルを使っているのではないかというほどの人気モデルになっています。

 そんなPony Diffusion開発者のPurpleSmartAIt氏が、SD3に疑問の声をあげたのがライセンス条項の問題でした。SD3Mのリリース日の6月12日に発表したブログ記事のなかで、SD3向けへのPony Diffusionの開発を当面はしないことを明らかにしたのです。

CivitAIに投稿されたPurpleSmartAI氏の投稿。Pony Diffusionは日本でも人気があることもあり、6月14日に日本語でも投稿されている

 記事によれば、SD3が「コミュニティーやファインチューニングへの支援が不十分」であり、「私の当初の目標は、これらの課題に真正面から取り組み、早期にSD3ベースのモデルを提供すること」としていました。しかし、SD3の商用ライセンスの内容は曖昧で、不安を感じる内容であったとしています。その後、問題を解決しようと、Stablity AIの技術チームと話す機会があったようですが、会話は「後味の悪いものだった」と述べています。

 「Ponyの目的や技術的な裏付けを理解しているとは思えず、予想外に高圧的な態度でした。問題の核心は、彼らがPonyをニッチに特化した(手間のかからない)ファインチューンに過ぎないと一蹴し、私の技術的な取り組みに興味を示さないことにあるように思えます」(PurpleSmartAI氏)

 SD3リリース後、ライセンスは「クリエイターズライセンス」にあらためられ、月6000枚の制限が付くようになり、それ以上の枚数を生成するには企業向けライセンスが必要という条件になりました。しかし、エンタープライズ(企業向け)ライセンスの具体的な内容は明らかにされず、問い合わせても、その時点では返答や情報が得られなかったと言います。そのため利用規約を通じて「恣意的な取り締まりによってSD3ベースモデルの種類を管理しようとする試みである可能性」があるとして、SD3用Pony Diffusionの開発へは「熱意が薄れた」と述べていました。

前へ 1 2 3 4 次へ

カテゴリートップへ

この連載の記事
ピックアップ