AI画像生成サービスなどを運営するAI Picassoは9月25日、追加学習において無断転載画像を学習していない画像生成AI、「Emi(Ethereal master of illustration)」を商用利用可能で無償公開。
あわせて、パブリックドメインの画像や著作権者から学習を許可された画像だけで学習させたクリーンな画像生成AI「Manga Diffusion」の概念実証版も開始したことを発表した。
無断転載画像を学習していないクリーンなAI
Emiは、Stability.AIが開発する「Stable Diffusion XL 1.0(SDXL)」をベースにAI Picassoが追加学習をし、AIアートに特化した画像生成モデルだ。
Stable Diffusionベースのモデルの中には、権利処理されていない画像を使って学習された疑いのあるモデルも多く問題となっているが、本モデルは「Danbooru(海外の画像転載サイト)」などにある無断転載画像を学習していないことが大きな特徴だ。
ライセンスは「Picasso Diffusion」など、これまで同社が発表してきたモデルと異なりSDXLと同様に、商用利用可能な「CreativeML Open RAIL++-M License」になっている。
理由としては「画像生成AIが普及するに伴い、創作業界に悪影響を及ぼさないように、マナーを守る人が増えてきた」ことに加え「他の画像生成AIが商用可能である以上、あまり非商用ライセンスである実効性がなくなってきた」ためとしている。
アニメやマンガのような出力に特化
本モデルは、アニメやマンガのようなAIアート生成に特化している。これまでのモデルよりも約2倍高精細になり、最近の画風になるように調整されているという。
Hugging Faceにて公開されているデモで試したところ「anime style, 1girl++」という簡単なプロンプトでこのような画像が生成された。なお、生成にかかった時間は約30秒だ。
プロンプトの他にも、ネガティブプロンプト、Guidance scale、Steps、Seed値といったStable Diffusionでもお馴染みのパラメーターが並んでいる。既存の画像を元に新たな画像を生成する「image to image」にも対応しているようだ。
なお、デモ以外にも、配布されているモデルを直接ダウンロードして、「ComfyUI」や「Fooocus」といったSDXL用のUIを使って使用することも可能だ。
「Manga diffusionの開発」
あわせて発表された「Manga diffusion」は、パブリックドメインの画像のみを学習しているモデルをベースに、著作権者から学習の許可を取った漫画用データセット「Manga 109s」データセットを追加学習したモデル。
表現力の限界から、今回はあくまで製品の実現可能性や有効性を確認するための、概念実証(proof of the concept)版となっている。
現状は、背景の生成に使うことが想定されているが、今後はこのモデルなどをベース にし、クリエイターにとって使い勝手が良い(権利処理がされている)モデルを開発していくことを予定しているという。
訴訟リスクの少ない「クリーンなAI」は、今この業界で最も求められているものかもしれない。
追記(2023年9月28日):Emiの学習方法について、AI Picassoから新たに情報を得たので以下に紹介する。
「Stable Diffusionの能力は、基本的に「知識」と「画風」に分かれていると思ってください。まず、50万枚の画像は知識を蓄えるために学習しています。例えば、「girl, blue hair」というプロンプトが青い髪の毛をした少女であることを理解させるものとして、学習させるために用意されています。
次の2000枚は、最新の流行の画風を再現しながら誰の画風でもない画風を再現するために学習しています。このように役割が違うために、2つのデータセットを用意して使われています」