画像生成AI「Stable Diffusion」がコンテンツ製作の技術革新を急速に促しているという話を「すさまじい勢いで世界を変えている画像生成AI」に書きました。あれから約2ヵ月が経ち、状況はさらに大きく変わってきています。
Novel AIソースコード流出事件
最も影響が大きかったのは10月8日に起きたとされる「Novel AI」のソースコード流出事件です。どういった形でハッキングされたのかは明らかにされていませんが、流出したとされるコードはおそらく本物だという結論になっています。
Novel AIは10月3日にサービスが開始された画像生成AIサービス。Stable Diffusionや「Midjourney」と比べても圧倒的に高品質な日本アニメ風の画像出力ができることにより、日本やアジア圏で高い人気を得ています。
Googleトレンドの傾向を見てみても、日本ではNovelAIがリリース後にトレンドのトップを維持しており、海外と比較しても人気の高さが伺えます。NovelAIは月額課金モデルで展開されており、最低設定で10ドルですが、25ドルのプランであれば、作成できるサイズに制限はあるものの、いくらでも画像を生成することができます。
ところが、リーク版Novel AIは現在ネット上で共有されていて、Stable Diffusionにデータセットのモデルとして読み込ませることができてしまいます。つまり無料で使うことができてしまうのです。もちろん、盗難されたデータということで、違法性の高いデータです。しかし、ネット上で共有され、一気に広がってしまったため、もはやその流通を止めることは事実上不可能になってしまいました。
Novel AIもStable Diffusionをベースに拡張開発されたものですが、ソースコードの流出により、どうやって品質の高い画像を生み出しているのかが明らかになりました。その中で画像を生成するための「プロンプト」と呼ばれるコマンドの研究がアジア圏で進み、10月中旬には「元素法典 第1巻」と呼ばれるプロンプト事典が公開されました。
「元素法典」は、日本の利用者にも大きな驚きを持って受け止められました。
Novel AIでは、これまでアニメ風の絵柄は出せるものの、絵画風の複雑な絵柄は作りにくいと考えられていたからです。しかし元素法典の中では、複雑で繊細な絵が作れるプロンプトも提案されていたんですね。
ただ、これがリーク版Novel AIで作られたプロンプトがかなり混じっているのは間違いありません。なぜかといえば、製品版のNovel AIにそのまま打ち込んでも完全に絵が出てこないというのが1つです。製品版Novel AIとリーク版Novel AIには微妙に違いがあるようで、同じプロンプトでも似たような絵は出ても、完全に同じ絵は出ません。さらに製品版のNovel AIにはプロンプトの文字数に225字の上限があるんですが、元素法典には上限をはるかに超える長文のプロンプトが含まれている手法も紹介されている中にはあるというのがもうひとつです。
現在、ローカル環境でStable Diffusionを動作させるアプリとして最も普及しているのは、AUTOMATIC1111さんが公開しているStable Diffusion web UIだと思われます。アプリにはプロンプト数の制限をなくしたバージョンがあり、リーク版Novel AIはそこでも動作するため、その環境で開発されたものではないかと推察できるんですね。
元素法典は、これまでのプロンプト以外にも、何を描いてほしくないかを指定する「ネガティブプロンプト」の有効性の発見にもつながり、劇的に画像生成AIの複雑な絵の作成に道を開くことになりました。現在では「元素法典 第2巻」もリリースされ、さらなる研究が進んでいます。

この連載の記事
- 第17回 「AIトレパク」が問題に
- 第16回 ゲームそのもののあり方を変えてしまった「Steam Deck」
- 第15回 来場者100万人 世界最大級のメタバース即売会「バーチャルマーケット」
- 第14回 ソニー「mocopi」が革新的だった理由
- 第12回 追いつめられたザッカーバーグ 年末商戦に生き残りかかる
- 第11回 メタ「Quest Pro」一般人にはおすすめできないが、可能性は感じる
- 第11回 メタバース的な未来を感じる「Wooorld」が面白い
- 第10回 ザッカーバーグの焦りを感じる「アバター問題」ふたたび
- 第9回 メタ「Quest Pro」仕事に使えるかは疑問だが、とりあえず予約した
- 第8回 今年最大のヒット作? VRゲーム「BONELAB」
- この連載の一覧へ