問題の「Stable Diffusion v1.5」は淘汰される可能性がある
それでも、Stable Diffusion v1.5は世界的に市場淘汰にあう可能性が出てきています。
まず、Stable Diffusion v1.5はベースの元々の出力画像の品質が低いこともあり、元のモデルのままでは、きちんとした画像を生成することは、ほぼ不可能です。筆者の使用経験からの感覚では、学習した画像をそのまま再現するほどの出力をすることは、まず無理であると考えます。
また、新ユーザーインターフェース「Stable Diffusion Forge」の登場により、VRAMの搭載量が少ないPCでも動作が可能になったこともあり、ユーザーのあいだでは、Stable Diffusion v1.5から2023年7月にリリースされたStable Diffusion XL(SDXL)への移行が進んできています。生成できる画像の品質が高いためです。
SDXLは、SD2.0以上に問題のある画像の削除が進められたモデルであるため、Stability AIの主張通りでであれば、CSAMといった問題のある画像は含まれていないと考えられます。
これは、今後、学習前にオプトアウトが実施された次世代バージョン「Stable Diffusion 3」の登場によりさらに問題は減少するでしょう。少なくとも、Stable Diffusionで中核で使われる基盤モデルにLAION-5BのCSAMが含まれているという問題は、技術的な発展を通じて解決に向かっていると言えます。
もちろん、Stable Diffusion v1.5からSDXLに至まで、ユーザーなどによって作成された追加学習モデルや、LoRAを使うことで、性的な表現の出力が可能になるものは実際に存在しています。v1.5を使って品質の高い画像を生成している場合は、追加学習をしたチェックポイントやLoRAが組み合わされていると言い切ってもいいでしょう。
それらに違法な画像が含まれている可能性は残る、という別の問題はあります。また、そもそもLAIONを学習元として利用したのかどうかを明らかにしていない、MidjourneyやOpenAIなどの様々な学習済みデータをサービスとして展開する企業もあります。学習済みデータからは何の画像データを学習しているのかを明らかにする方法がない以上、今後も本当に違法性のあるデータが含まれているかどうかは争点になり続けるでしょう。
ただ、今後は、生成・利用段階の結果に対するものへの規制が主流となっていくとは考えられます。
この連載の記事
-
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは -
第77回
AI
画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に -
第76回
AI
「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」 -
第75回
AI
商業漫画にAIが使われるようになってきた - この連載の一覧へ