画像生成AI「Stable Diffusion XL(SDXL)」のファインチューニングモデル、「NoobAI-XL(ヌーブエーアイ)」の登場が、画像生成AI関連の人たちをざわつかせています。イラスト風画像の生成性能が高いためです。ハイエンドモデルの「Stable Diffusion 3.5」や「Flux.1」への移行が始まろうとするなか、昨年8月にリリースされた旧モデルのSDXLに性能向上の余地がまだまだあることが明らかになってきたのです。
SDXLベースの画像生成AIモデル「NoobAI-XL」の性能が高すぎる
NoobAI-XLの強力さは、LCM(Latent Consistency Models=画像生成AIの高速化技術)の環境で動かすとそのすごさがよくわかります。ペイントツール「Krita」用にAclyさんが開発を続けている独自プラグイン「Krita AI Diffusion」でプロンプトを設定して、雑に落書きを描いてみても、そこからしっかりとした画像が生成されます。特に強度を0.67など強めに設定すると、手足の複雑な絡みがあってもそれなりに認識し、破綻することのない画像を生成してくれるのです。この精度は、SD1.5系のモデルや、過去に人気のあったSDXLモデルの「Animagine XL」では実現できていませんでした。どうなっているのかと驚かされるレベルです。
Krita AI DiffusionでNoobAI-XLの派生モデルの「Illustrious XL personal merge」を利用してリアルタイム生成している様子。右が筆者が描いた落書きで、それをプロンプトと合わせて解釈して、それっぽい画像(左)が生成される。雑であっても、着彩すると精度が上がる
他のモデルとの比較。プロンプトは同じ。Stable Diffusion 1.5では元の画像はほぼ無視されており、Animagine XLでは剣が描写されていない。最新モデルのFlux.1 schnellではアニメ系が苦手であるために弱さが出ている。最後のNoobAI-XLは、一度生成した画像を使って、さらに同じ条件で生成したもので、指や服の曖昧さが消えて、より精緻に描写されている
剣を握っている女性を描いても完璧です。SDXLでは、武器と手の関係性といったものの描写は従来から苦手でしたが、NoobAI-XLではそれなりに描写できています。
このように、SDXLがリリースされて1年経って、土台としたモデルの性能が上がってきているという状況です。ハイエンドモデルとしては、8月にBlack Forest Labsの「FLUX.1」がリリースされていますが、人体については、そのまま出力すると、正面の立ったままの動きのない画像となりがちな傾向があります。アニメ系の画風で、複雑なポーズをとらせた画像生成目的であれば、NoobAI-XLの方が上かもしれません。
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第150回
AI
無料でここまで? 動画生成AI「LTX-2.3」はWan2.2の牙城を崩すか -
第149回
AI
AIと8回話しただけで“性格が変わる” 研究が警告する「おべっかAI」の影響 -
第148回
AI
AIが15万字の小説を1週間で執筆──「Claude Opus 4.6」が示した創作の未来 -
第147回
AI
ゲーム開発開始から3年、AIは“必須”になった──Steam新作「Exelio」の舞台裏 -
第146回
AI
ローカル音楽生成AIの新定番? ACE-Step 1.5はSuno連携で化ける -
第145回
AI
ComfyUI、画像生成AI「Anima」共同開発 アニメ系モデルで“SDXL超え”狙う -
第144回
AI
わずか4秒の音声からクローン完成 音声生成AIの実力が想像以上だった -
第143回
AI
AIエージェントが書いた“異世界転生”、人間が書いた小説と見分けるのが難しいレベルに -
第142回
AI
数枚の画像とAI動画で“VTuber”ができる!? 「MotionPNG Tuber」という新発想 -
第141回
AI
AIエージェントにお金を払えば、誰でもゲームを作れてしまうという衝撃の事実 開発者の仕事はどうなる? -
第140回
AI
3Dモデル生成AIのレベルが上がった 画像→3Dキャラ→動画化が現実的に - この連載の一覧へ






