5月15日にComfyUIが共同開発している画像生成AIモデル「Anima Base v1.0」が公開されました。2B(20億)パラメータで、本体モデルのファイルサイズも4.18GBと比較的小さいモデルですが、ローカルPC環境で動作するアニメスタイル専用モデルとして、高性能に仕上がっています。その強力さは、追加学習用のLoRAを作成すると、さらに明確に分かります。これまで、GPT Image 2.0などのクラウドモデルでは実現できていましたが、ローカルPCで使えるオープンモデルでは、複雑なキャラクターの一貫性を保つのが難しい状況でした。その限界を突破する存在になりそうです。
ComfyUI共同開発のアニメ系モデル「Anima」
Animaは、ComfyUIから資金提供を受けている米Circle Stone Labが、1月からプレビュー版の公開を開始し、毎月のようにアップデートを重ねてきました(参考:ComfyUI、画像生成AI「Anima」共同開発 アニメ系モデルで“SDXL超え”狙う )。Anima Base v1.0は、ベースとなる完成版モデルで、学習が進んだことで、Preview版にあったノイズ感はほとんど解消されており、クリアな画質で出力できます。モデルサイズは4.18GBと大型化が進む近年のモデルの中では小さく、ビデオカードのVRAMが8GBでも動作します。しかし、解像度は一般的な1024x1024よりかなり大きい1536x1536までサポートしています。筆者のA6000搭載(RTX 3090に相当)では、1024x1024の画像を1枚生成するのに、約30秒かかります。
Animaでクリアかつ品質が高い画像が出せるのはいいのですが、弱点もあります。生成するたびに、画風が大きく揺れるのです。同じプロンプトであっても、キャラクターの雰囲気はかなり変わってしまいます。プロンプトだけで制御するのは難しいようです。そこで効果を発揮するのがLoRAです。Animaの画像の揺れを抑制し、自分の意図する画像へコントロールしやすくなるのです。 Anima用のLoRA作成環境は、日本人技術者のKohya Tech(@kohya_tech)さんが継続的に開発を続けている世界的なデファクトスタンダードの一つである「sd-scripts」が、2月にAnimaをサポートしました。それをgazingstarsさんがGUI化し、使いやすくした「Anima Standalone Trainer」として公開しました。
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第157回
AI
AIだけでゲームは作れるのか? Codexに7本作らせて見えた実力と限界 -
第156回
AI
ChatGPTの画像生成AIは本当に最強か Nano Bananaと比べて見えた“弱点” -
第155回
AI
非エンジニアが数百万円級のツールを開発 画像&動画生成AIツールがゼロから作れた話 -
第154回
AI
ChatGPTの画像生成AIが強すぎる AI画像が世界中に氾濫する時代へ -
第153回
AI
ChatGPTの画像生成AIが「Nano Banana」超え? 漫画や動画風カットが実用レベルに -
第152回
AI
Seedance 2.0×AIエージェントでAI動画が激変 “AI脚本家”や“AI絵コンテ作家”との共同作業で、アニメ制作が身近に -
第151回
AI
画像・動画生成AIの常識が変わる、Claude Codeに全部やらせる方法論 -
第150回
AI
無料でここまで? 動画生成AI「LTX-2.3」はWan2.2の牙城を崩すか -
第149回
AI
AIと8回話しただけで“性格が変わる” 研究が警告する「おべっかAI」の影響 -
第148回
AI
AIが15万字の小説を1週間で執筆──「Claude Opus 4.6」が示した創作の未来 - この連載の一覧へ







