普段メタバースのトレンドを時評的に解説する「メタバース・プレゼンス」を連載していますが、画像生成AIがすごいことになっているので、今回は番外編としてそれをお話させてください。今年8月、画像生成AI「Stable Diffusion」が公開された影響がすさまじい勢いで出てきているんです。いま起きているのはStable Diffusionの派生技術が大量に出てきていること。大きく分けて2つのポイントがあるなと感じています。
Windows向けソフトで誰でも使えるStable Diffusion
1つのポイントは、Windowsローカル環境で使える、GUI形式の扱いやすいソフトが出てきたことです。
NMKD Stable Diffusion GUI
作者:N00MKRAD
OS:Windows 10/11 64bit
推奨環境:最新版NVIDIA GPU(RTXシリーズ推奨)、メモリ16GB以上など
https://nmkd.itch.io/t2i-gui
いま個人的に使ってるのがこのソフト。ありがたいのは、プロンプト周りを含めたローカルの環境構築をすべてやってくれること。これまでStable DiffusionはPythonを使ったり、Google Colabを使ったりと専門知識がない人にはそれなりに技術的なハードルが高かったんですが、そこそこのビデオカードを搭載したゲーミングPCにソフトをインストールすれば、誰でもStable Diffusionが使えるようになります。
バージョン1.2.0のときは重くて使いものになりませんでしたが、バージョン1.4.0で様々な改善がなされたことで劇的に軽くなり「ヤバい!」という感覚になりました。プロンプトを作成、もしくはコピペして生成量を設定し、「Generate」ボタンを押して、待つだけで画像が生成されます。GPUはNVIDIA GeForce RTX 3070で動かしていますが、10〜30秒単位で画像が次々に生成されていきます。本当に軽くて簡単です。
もちろんローカル環境なので生成した画像のプロンプト(呪文)はすべて非公開ですし、公開前提のサービスと違ってアダルト画像を出すこともできます(笑)。ただし、これはAI作成者の制限事項としてアダルト画像について「追加の安全機構や考慮なしに製品使用するには適しません」としているので、不用意に公開したりすることはしないようにしてくださいね。
学習パッケージ追加で「アニメ絵」も強化
もう1つのポイントは、Stable Diffusionの学習パッケージを拡張する流れが出てきたこと。Stable Diffusionの公開された情報を元に、別の画像セットを追加で数十万枚学習させたデータセットを別途ダウンロードして、別データパッケージとして追加できるようになったんですね。
たとえば、Stable Diffusionは日本のアニメっぽい画像に強いわけではなかったのでグシャッとした画像になりがちでした。そこに8月に発表された「Waifu Diffusion」という学習パッケージを追加することで、いわゆる「アニメ絵」が出せるようになります。
Waifu Diffusion
https://huggingface.co/hakurei/waifu-diffusion
「Waifu Diffusion」は日本のアニメが好きなエンジニアが開発している学習パッケージで、継続的なアップデートが続けられています。いま一般に使われているVersion 1.2では30万枚のイメージ画像が学習データとして使われています。アニメ風の画像を出すにはそれだけでもかなり強力です。現在進められている開発はVersion 1.3なのですが、60万枚から最大200万枚の画像を学習データとしてより高度なものになろうとしています。10月8日に大型アップデートをすることが公式Discordで明らかにされています。
夕陽と黒ドレス#stablediffusion#WaifuDiffusionpic.twitter.com/AaezGyOyWb
— raum (@raum9) October 2, 2022
Middle of the night #WaifuDiffusion#stablediffusionpic.twitter.com/PyTqpcJMM1
— Stuffy (AI Art) (@StuffyAi) October 3, 2022
見てもらうとわかるかと思いますが、本当にすごいですよね。画像を生成するためのプロンプトはツイッターのALTタグで公開している人が多い印象です。それを元に様々なワードを追加したり、減らしたりすることで自分の好みの絵柄を追求していくことができます。
ほかにもアニメっぽい顔の描写に強い「TrinArt」などの学習パッケージがあり、それを追加することもできます。
TrinArt
https://huggingface.co/naclbit/trinart_stable_diffusion_v2
#trinart
— Bit192 Labs 【AIのべりすと / Tone Sphere】 (@_bit192) October 5, 2022
「きれいな絵を出すにはどうしたらいい?」という方のためにいくつかプロンプトのタネをご紹介しますッ!
ALTをご覧ください。これは俗にソシャゲ風といわれるような感じ。 pic.twitter.com/wSWWNPksxT
学習パッケージは1つあたり3~7GBくらいあるのですが、それをフォルダーの中に放り込んでいくだけで使えます。ツールによっては複数の学習パッケージを混ぜて使うこともできます。基本のシステムはStable Diffusionなので、どの学習パッケージの影響力をもたせるかという混合が可能なんですね。
この連載の記事
-
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
トピックス
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは -
第77回
AI
画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に -
第76回
AI
「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」 -
第75回
AI
商業漫画にAIが使われるようになってきた -
第74回
AI
AIバブル崩壊をめぐって -
第73回
AI
AIは著作物の「フェアユース」と言えるのか 音楽業界vs.AIミュージック - この連載の一覧へ