問題の「Stable Diffusion v1.5」は淘汰される可能性がある
それでも、Stable Diffusion v1.5は世界的に市場淘汰にあう可能性が出てきています。
まず、Stable Diffusion v1.5はベースの元々の出力画像の品質が低いこともあり、元のモデルのままでは、きちんとした画像を生成することは、ほぼ不可能です。筆者の使用経験からの感覚では、学習した画像をそのまま再現するほどの出力をすることは、まず無理であると考えます。
また、新ユーザーインターフェース「Stable Diffusion Forge」の登場により、VRAMの搭載量が少ないPCでも動作が可能になったこともあり、ユーザーのあいだでは、Stable Diffusion v1.5から2023年7月にリリースされたStable Diffusion XL(SDXL)への移行が進んできています。生成できる画像の品質が高いためです。
SDXLは、SD2.0以上に問題のある画像の削除が進められたモデルであるため、Stability AIの主張通りでであれば、CSAMといった問題のある画像は含まれていないと考えられます。
これは、今後、学習前にオプトアウトが実施された次世代バージョン「Stable Diffusion 3」の登場によりさらに問題は減少するでしょう。少なくとも、Stable Diffusionで中核で使われる基盤モデルにLAION-5BのCSAMが含まれているという問題は、技術的な発展を通じて解決に向かっていると言えます。
もちろん、Stable Diffusion v1.5からSDXLに至まで、ユーザーなどによって作成された追加学習モデルや、LoRAを使うことで、性的な表現の出力が可能になるものは実際に存在しています。v1.5を使って品質の高い画像を生成している場合は、追加学習をしたチェックポイントやLoRAが組み合わされていると言い切ってもいいでしょう。
それらに違法な画像が含まれている可能性は残る、という別の問題はあります。また、そもそもLAIONを学習元として利用したのかどうかを明らかにしていない、MidjourneyやOpenAIなどの様々な学習済みデータをサービスとして展開する企業もあります。学習済みデータからは何の画像データを学習しているのかを明らかにする方法がない以上、今後も本当に違法性のあるデータが含まれているかどうかは争点になり続けるでしょう。
ただ、今後は、生成・利用段階の結果に対するものへの規制が主流となっていくとは考えられます。
この連載の記事
-
第64回
AI
自分好みのAIチャット相手を簡単に作れる「Dify」が面白い -
第63回
AI
まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 -
第62回
AI
動画生成AI、映像制作の“民主化”目指して研究進む -
第60回
AI
3Dアニメーション技術の革新が止まらない -
第59回
AI
政府、生成AI推進に向けて議論を加速 -
第58回
AI
画像生成AIで同じキャラクターが簡単に作れるようになってきた -
第57回
AI
日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に -
第56回
AI
画像生成AIの著作権問題、文化庁議論で争点はっきり -
第55回
AI
動画生成AIの常識を破壊した OpenAI「Sora」の衝撃 -
第54回
AI
画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 - この連載の一覧へ