今後はオープンソースならではの“派生展開”に注目
一方、Stable Diffusion v1.5以上の普及を目指す上で、重要なのはSDXLそのものというより、リリースされた後に周辺環境が整ってくることなんですよね。「DreamStudio」の人気がないのも、カスタム化などが全然できなかったためだとも思えます。
メジャーなStable Diffusionの動作環境であるA1111 WebUIは、フォーク環境(派生環境)で正式対応が始まっています。ControlNetもおそらくは正式リリース後に順次組み込まれてくるでしょう。現状は要求スペックが高くv1.5ほど簡単ではないとはいわれていますが、追加モデルも開拓されていくのではないでしょうか。
ただし、Stable Diffusionの人気を高める要因になったLoRAといった追加学習データについては、これまでv1.5やv2.0用に作られてきたデータとの互換性はありません。そのためあらためて作り直しになります。まだ、簡単な方法の開発は模索されている最中ですが、Redditユーザーの報告によると、これまで5000枚の画像を学習させても出なかった画風の学習が、わずか100枚を使った学習で出せるようになったとの報告も出ています。それだけ、SDXLの潜在的な能力が高いことを示していると思われます。ただビデオメモリーなど要求されている仕様は上がっており、追加学習に実行環境よりもさらにハードウェアスペックが求められそうです。
OSのバージョンアップのようなもので、新バージョンのリリースに伴う課題はたくさんありますが、オープンソースの強みを生かして新たな様々なノウハウが発見され、作られて、SDXLの潜在的なクオリティーが、登場してくると思われます。SDXL 0.9は思いのままの画像を作るにはまだ難しいですが、性能は高そうなのでいじりがいはありそうだなという感想です。2022年8月に最初のリリースから約1年で、大きく世界のあり方を変えてしまった画像生成AIのひとつですが、今回の進化はどんな影響を与えていくことになるのでしょうか。
この連載の記事
-
第87回
AI
画像生成AIの進化が早すぎる 2024年に起きたことまとめ -
第86回
AI
イラストに強すぎる画像生成AIモデル SDXL系「NoobAI-XL」の衝撃 -
第85回
AI
3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 -
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは - この連載の一覧へ