AI Picassoが9月25日に公開した、アニメやマンガのようなAIアート生成に特化した画像生成AI「Emi(Ethereal master of illustration)」。無断転載画像を追加学習に使用していないと明言しており、商用利用可能ということもあって注目を集めている。
「Stable Diffusion XL(SDXL)」ベースということで、SDXLを簡単に利用できる新しいWebUI「Fooocus」にも対応済み。どんな画像を生成できるのかさっそく試してみた。
なお、「Fooocus」のインストール方法などについてはこの記事を参照してほしい。
モデルをダウンロードして指定フォルダーに入れるだけ
まずは「Emi」のダウンロードから。Hugging Faceにあるダウンロードページから「emi_stable.safetensors」をダウンロードする。7GB近くあるので気長に待とう。
ダウンロードしたファイルは「Fooocus」フォルダー内の「\models\checkpoints」にコピーしておこう。準備はたったのこれだけだ。さっそく「Fooocus」を起動しよう。
起動したら画面左下にある「Advanced」にチェックを入れる。
右側に各種パラメーターが表示されるので「Advanced」タブにある「SDXL Base Model」プルダウンメニューから先程コピーした「emi_stable.safetensors」を選択。リファイナーは用意されていないようなのでSDXLのものを使用する。
「Style」タブでは生成される画像のスタイルを指定できるが、まずはEmi単体の実力を見たいため、すべてのチェックを外しておこう。
設定が終わったら、さっそくプロンプト欄にいつもの呪文「1 girl」を入れてGenerateだ。
うーん、実写系だなあ、、。
ということでEmiのModel Card(モデルについての説明が書かれているページ)を熟読すると、「モデルの出力向上について」の項にたくさんのアドバイスが書かれていた。
「確実にアニメ調のイラストを出したいときは、anime artwork, anime styleとプロンプトの先頭に入れてください」
ということで、まずは上記を参考にプロンプトを改造。
おお!!ばっちりアニメ絵になった。
「プロンプトにtransparentという言葉を入れると、より最近の画風になります。」
とのことなので、それも追加。
うん、よくなった気がする。
「ネガティブプロンプトにTextual Inversionを使用することをおすすめします。」
「Textual Inversion」は、モデルに対して追加の学習結果を適用できるStable Diffusionの機能。こちらの指示に従い、「unaestheticXL」というTextual Inversionを導入した。
ファイルのインストール先は「Fooocus」フォルダー内の「\models\embeddings」だ。
もちろん完璧ではないが、かなり完成度が上がってきたのではないだろうか。
多少輪郭や指先が怪しいのはご愛嬌、これをベースに細かく修正をかけていけばいいだろう。