画像生成AI「Stable Diffusion XL(SDXL)」のファインチューニングモデル、「NoobAI-XL(ヌーブエーアイ)」の登場が、画像生成AI関連の人たちをざわつかせています。イラスト風画像の生成性能が高いためです。ハイエンドモデルの「Stable Diffusion 3.5」や「Flux.1」への移行が始まろうとするなか、昨年8月にリリースされた旧モデルのSDXLに性能向上の余地がまだまだあることが明らかになってきたのです。
SDXLベースの画像生成AIモデル「NoobAI-XL」の性能が高すぎる
NoobAI-XLの強力さは、LCM(Latent Consistency Models=画像生成AIの高速化技術)の環境で動かすとそのすごさがよくわかります。ペイントツール「Krita」用にAclyさんが開発を続けている独自プラグイン「Krita AI Diffusion」でプロンプトを設定して、雑に落書きを描いてみても、そこからしっかりとした画像が生成されます。特に強度を0.67など強めに設定すると、手足の複雑な絡みがあってもそれなりに認識し、破綻することのない画像を生成してくれるのです。この精度は、SD1.5系のモデルや、過去に人気のあったSDXLモデルの「Animagine XL」では実現できていませんでした。どうなっているのかと驚かされるレベルです。
Krita AI DiffusionでNoobAI-XLの派生モデルの「Illustrious XL personal merge」を利用してリアルタイム生成している様子。右が筆者が描いた落書きで、それをプロンプトと合わせて解釈して、それっぽい画像(左)が生成される。雑であっても、着彩すると精度が上がる
他のモデルとの比較。プロンプトは同じ。Stable Diffusion 1.5では元の画像はほぼ無視されており、Animagine XLでは剣が描写されていない。最新モデルのFlux.1 schnellではアニメ系が苦手であるために弱さが出ている。最後のNoobAI-XLは、一度生成した画像を使って、さらに同じ条件で生成したもので、指や服の曖昧さが消えて、より精緻に描写されている
剣を握っている女性を描いても完璧です。SDXLでは、武器と手の関係性といったものの描写は従来から苦手でしたが、NoobAI-XLではそれなりに描写できています。
このように、SDXLがリリースされて1年経って、土台としたモデルの性能が上がってきているという状況です。ハイエンドモデルとしては、8月にBlack Forest Labsの「FLUX.1」がリリースされていますが、人体については、そのまま出力すると、正面の立ったままの動きのない画像となりがちな傾向があります。アニメ系の画風で、複雑なポーズをとらせた画像生成目的であれば、NoobAI-XLの方が上かもしれません。

この連載の記事
-
第134回
AI
“AI読者”が小説執筆の支えに 感想を励みに30話まで完成 -
第133回
AI
xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル -
第132回
AI
画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」 -
第131回
AI
AIに恋して救われた人、依存した人 2.7万人の告白から見えた“現代の孤独”と、AI設計の問題点 -
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 - この連載の一覧へ






