このページの本文へ

前へ 1 2 次へ

新清士の「メタバース・プレゼンス」 第7回

すさまじい勢いで世界を変えている画像生成AI

2022年10月06日 16時00分更新

文● 新清士 編集● ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 普段メタバースのトレンドを時評的に解説する「メタバース・プレゼンス」を連載していますが、画像生成AIがすごいことになっているので、今回は番外編としてそれをお話させてください。今年8月、画像生成AI「Stable Diffusion」が公開された影響がすさまじい勢いで出てきているんです。いま起きているのはStable Diffusionの派生技術が大量に出てきていること。大きく分けて2つのポイントがあるなと感じています。

Windows向けソフトで誰でも使えるStable Diffusion

 1つのポイントは、Windowsローカル環境で使える、GUI形式の扱いやすいソフトが出てきたことです。

NMKD Stable Diffusion GUI
作者:N00MKRAD
OS:Windows 10/11 64bit
推奨環境:最新版NVIDIA GPU(RTXシリーズ推奨)、メモリ16GB以上など

https://nmkd.itch.io/t2i-gui

 いま個人的に使ってるのがこのソフト。ありがたいのは、プロンプト周りを含めたローカルの環境構築をすべてやってくれること。これまでStable DiffusionはPythonを使ったり、Google Colabを使ったりと専門知識がない人にはそれなりに技術的なハードルが高かったんですが、そこそこのビデオカードを搭載したゲーミングPCにソフトをインストールすれば、誰でもStable Diffusionが使えるようになります。

 バージョン1.2.0のときは重くて使いものになりませんでしたが、バージョン1.4.0で様々な改善がなされたことで劇的に軽くなり「ヤバい!」という感覚になりました。プロンプトを作成、もしくはコピペして生成量を設定し、「Generate」ボタンを押して、待つだけで画像が生成されます。GPUはNVIDIA GeForce RTX 3070で動かしていますが、10〜30秒単位で画像が次々に生成されていきます。本当に軽くて簡単です。

 もちろんローカル環境なので生成した画像のプロンプト(呪文)はすべて非公開ですし、公開前提のサービスと違ってアダルト画像を出すこともできます(笑)。ただし、これはAI作成者の制限事項としてアダルト画像について「追加の安全機構や考慮なしに製品使用するには適しません」としているので、不用意に公開したりすることはしないようにしてくださいね。

学習パッケージ追加で「アニメ絵」も強化

 もう1つのポイントは、Stable Diffusionの学習パッケージを拡張する流れが出てきたこと。Stable Diffusionの公開された情報を元に、別の画像セットを追加で数十万枚学習させたデータセットを別途ダウンロードして、別データパッケージとして追加できるようになったんですね。

 たとえば、Stable Diffusionは日本のアニメっぽい画像に強いわけではなかったのでグシャッとした画像になりがちでした。そこに8月に発表された「Waifu Diffusion」という学習パッケージを追加することで、いわゆる「アニメ絵」が出せるようになります。

Waifu Diffusion
https://huggingface.co/hakurei/waifu-diffusion

 「Waifu Diffusion」は日本のアニメが好きなエンジニアが開発している学習パッケージで、継続的なアップデートが続けられています。いま一般に使われているVersion 1.2では30万枚のイメージ画像が学習データとして使われています。アニメ風の画像を出すにはそれだけでもかなり強力です。現在進められている開発はVersion 1.3なのですが、60万枚から最大200万枚の画像を学習データとしてより高度なものになろうとしています。10月8日に大型アップデートをすることが公式Discordで明らかにされています。

 見てもらうとわかるかと思いますが、本当にすごいですよね。画像を生成するためのプロンプトはツイッターのALTタグで公開している人が多い印象です。それを元に様々なワードを追加したり、減らしたりすることで自分の好みの絵柄を追求していくことができます。

 ほかにもアニメっぽい顔の描写に強い「TrinArt」などの学習パッケージがあり、それを追加することもできます。

TrinArt
https://huggingface.co/naclbit/trinart_stable_diffusion_v2

 学習パッケージは1つあたり3~7GBくらいあるのですが、それをフォルダーの中に放り込んでいくだけで使えます。ツールによっては複数の学習パッケージを混ぜて使うこともできます。基本のシステムはStable Diffusionなので、どの学習パッケージの影響力をもたせるかという混合が可能なんですね。

前へ 1 2 次へ

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン