イラストに強すぎる画像生成AIモデル　SDXL系「NoobAI-XL」の衝撃

2024年12月02日 07時00分更新

文● 新清士

NoobAI-XLを使って作成した魔法使いの画像（筆者作成）

　画像生成AI「Stable Diffusion XL（SDXL）」のファインチューニングモデル、「NoobAI-XL（ヌーブエーアイ）」の登場が、画像生成AI関連の人たちをざわつかせています。イラスト風画像の生成性能が高いためです。ハイエンドモデルの「Stable Diffusion 3.5」や「Flux.1」への移行が始まろうとするなか、昨年8月にリリースされた旧モデルのSDXLに性能向上の余地がまだまだあることが明らかになってきたのです。

SDXLベースの画像生成AIモデル「NoobAI-XL」の性能が高すぎる

　NoobAI-XLの強力さは、LCM（Latent Consistency Models＝画像生成AIの高速化技術）の環境で動かすとそのすごさがよくわかります。ペイントツール「Krita」用にAclyさんが開発を続けている独自プラグイン「Krita AI Diffusion」でプロンプトを設定して、雑に落書きを描いてみても、そこからしっかりとした画像が生成されます。特に強度を0.67など強めに設定すると、手足の複雑な絡みがあってもそれなりに認識し、破綻することのない画像を生成してくれるのです。この精度は、SD1.5系のモデルや、過去に人気のあったSDXLモデルの「Animagine XL」では実現できていませんでした。どうなっているのかと驚かされるレベルです。

Krita AI DiffusionでNoobAI-XLの派生モデルの「Illustrious XL personal merge」を利用してリアルタイム生成している様子。右が筆者が描いた落書きで、それをプロンプトと合わせて解釈して、それっぽい画像（左）が生成される。雑であっても、着彩すると精度が上がる

他のモデルとの比較。プロンプトは同じ。Stable Diffusion 1.5では元の画像はほぼ無視されており、Animagine XLでは剣が描写されていない。最新モデルのFlux.1 schnellではアニメ系が苦手であるために弱さが出ている。最後のNoobAI-XLは、一度生成した画像を使って、さらに同じ条件で生成したもので、指や服の曖昧さが消えて、より精緻に描写されている

　剣を握っている女性を描いても完璧です。SDXLでは、武器と手の関係性といったものの描写は従来から苦手でしたが、NoobAI-XLではそれなりに描写できています。

　このように、SDXLがリリースされて1年経って、土台としたモデルの性能が上がってきているという状況です。ハイエンドモデルとしては、8月にBlack Forest Labsの「FLUX.1」がリリースされていますが、人体については、そのまま出力すると、正面の立ったままの動きのない画像となりがちな傾向があります。アニメ系の画風で、複雑なポーズをとらせた画像生成目的であれば、NoobAI-XLの方が上かもしれません。

前へ 1 2 3 4 5 次へ

ツイートする

カテゴリートップへ