Stable Diffusion入門 from Thailand 第3回
画像生成AI「Stable Diffusion XL(SDXL)」の使い方 初めてなら「Fooocus」がオススメです
2023年09月14日 09時00分更新
複雑化するStable Diffusion界隈
前回からずいぶん間が空いてしまったが、ようやく第3回である。
届いたパソコンに「Python」、「Git」、動作環境「WebUI(A1111版、以下「WebUI」と略記)」をインストールして、1枚目の画像を生成したところで前回は終わってしまったのだが、もちろんその後なにもせずに1ヵ月が過ぎてしまったわけではない。
実はこの後、プロンプトの研究、各種パラメーターの把握、モデルとVAE(オートエンコーダーの一種)の探求、様々なExtension(拡張機能)の導入、Custom Script、LoRA、ControlNet、LyCORISなどなど様々なことを調べ、試してはいたのだが……。
とにかく調べなきゃいけないことが多すぎる!!!
そもそもStable Diffusion自体が登場から1年もたっていないうえに、オープンソースで公開されているため、世界中の猛者たちが試行錯誤しながら毎日新たなテクニックを考案したり、新たなツールやモデルを開発・公開している世界だ。
それゆえ定番的なテクニックすらすぐに時代遅れになってしまい、毎日の情報キャッチアップが必要になってくる。
Web UI自体も頻繁にアップデートを重ねている上に、派生モデルやLoRA、別の人が開発したExtensionなどを導入していった結果、インストール時点から比べ物にならないほどUIも複雑化してしまった。
そしてとどめとなったのが7月27日に登場したStable Diffusionの最新バージョンとなる「Stable Diffusion XL 1.0(SDXL 1.0)」だ。
参考:最新の画像生成AI「SDXL 1.0」実写系イラストのクオリティがすごい!!
SDXL以前は「Stable Diffusion v1.5(SD v1.5)」が主流となっており、多くの派生モデルや拡張機能が開発されていたのだが、SDXLは以前のバージョンとかなり異なっている。
特に「Base」と「Refiner」という2つのモデルを組み合わせて使う必要があるため、当初「Stable Diffusion Web UI」では、少し面倒な手順を踏む必要(現在は対応済み)があった。
また、画像をある程度コントロールできる「LoRA」の多くは、SD v1.5用でSDXLには対応していないなど、互換性に問題がある。
以上のようなこともあり「さて、どこから説明していけばいいのやら……。」と悩んでしまっていたというのが更新が遅れた理由だ。
(いまごろ始めた『サイバーパンク2077』に時間を吸い取られてしまったことは別として)
この連載の記事
-
第26回
AI
人気の画像生成AIツール「ComfyUI」デスクトップアプリがめっちゃラク 初心者にオススメ -
第25回
AI
業界トップ級の画像生成AIツール「Recraft」 Adobeユーザーは体験する価値あり -
第24回
AI
SD3.0の汚名返上なるか?!画像生成AI「Stable Diffusion 3.5」を試してみた -
第23回
AI
最新の画像生成AI「FLUX1.1 [pro]」違いは? Midjourney、DALL-E、Imagen 3、Stable Image Ultraと比較 -
第22回
AI
画像生成AI「Midjourney」の使い方 Webアプリ版の画像編集機能を完全マスター -
第21回
AI
画像生成AI「Midjourney」の使い方 待望のWebアプリ版を徹底的に解説します -
第20回
AI
話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす(高速化も試してみました) -
第19回
AI
画像生成AI「Stable Diffusion」の代替に? 話題の「FLUX.1」を試した -
第18回
AI
イラストを完成させる動画はAIで作れるのか「Paints-Undo」試してみた -
第17回
AI
人気の画像生成AI、違いは? Stable Diffusion XL、Midjourney、DALL-E、Playgroundの画風を比較する -
第16回
AI
画像生成AI「Midjourney」の使い方 画風やキャラクターを固定する「スタイルリファレンス」「キャラクターリファレンス」はこう使う - この連載の一覧へ