今後はオープンソースならではの“派生展開”に注目
一方、Stable Diffusion v1.5以上の普及を目指す上で、重要なのはSDXLそのものというより、リリースされた後に周辺環境が整ってくることなんですよね。「DreamStudio」の人気がないのも、カスタム化などが全然できなかったためだとも思えます。
メジャーなStable Diffusionの動作環境であるA1111 WebUIは、フォーク環境(派生環境)で正式対応が始まっています。ControlNetもおそらくは正式リリース後に順次組み込まれてくるでしょう。現状は要求スペックが高くv1.5ほど簡単ではないとはいわれていますが、追加モデルも開拓されていくのではないでしょうか。
ただし、Stable Diffusionの人気を高める要因になったLoRAといった追加学習データについては、これまでv1.5やv2.0用に作られてきたデータとの互換性はありません。そのためあらためて作り直しになります。まだ、簡単な方法の開発は模索されている最中ですが、Redditユーザーの報告によると、これまで5000枚の画像を学習させても出なかった画風の学習が、わずか100枚を使った学習で出せるようになったとの報告も出ています。それだけ、SDXLの潜在的な能力が高いことを示していると思われます。ただビデオメモリーなど要求されている仕様は上がっており、追加学習に実行環境よりもさらにハードウェアスペックが求められそうです。
OSのバージョンアップのようなもので、新バージョンのリリースに伴う課題はたくさんありますが、オープンソースの強みを生かして新たな様々なノウハウが発見され、作られて、SDXLの潜在的なクオリティーが、登場してくると思われます。SDXL 0.9は思いのままの画像を作るにはまだ難しいですが、性能は高そうなのでいじりがいはありそうだなという感想です。2022年8月に最初のリリースから約1年で、大きく世界のあり方を変えてしまった画像生成AIのひとつですが、今回の進化はどんな影響を与えていくことになるのでしょうか。
この連載の記事
-
第66回
AI
有名人そっくり、増え続けるAI音声 “声の権利”どう守る -
第65回
AI
画像生成AIに照明革命 日本と世界で同時に“神ツール”登場 -
第64回
AI
自分好みのAIチャット相手を簡単に作れる「Dify」が面白い -
第63回
AI
まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 -
第62回
AI
動画生成AI、映像制作の“民主化”目指して研究進む -
第61回
AI
画像生成AI“児童ポルノ”学習問題、日本では表現規制の議論にも -
第60回
AI
3Dアニメーション技術の革新が止まらない -
第59回
AI
政府、生成AI推進に向けて議論を加速 -
第58回
AI
画像生成AIで同じキャラクターが簡単に作れるようになってきた -
第57回
AI
日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に -
第56回
AI
画像生成AIの著作権問題、文化庁議論で争点はっきり - この連載の一覧へ