このページの本文へ

前へ 1 2 3 4 5 次へ

新清士の「メタバース・プレゼンス」 第158回

SDXLの次はこれ? アニメ特化のローカル画像生成AI、驚きの実力

2026年05月25日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷
 

 5月15日にComfyUIが共同開発している画像生成AIモデル「Anima Base v1.0」が公開されました。2B(20億)パラメータで、本体モデルのファイルサイズも4.18GBと比較的小さいモデルですが、ローカルPC環境で動作するアニメスタイル専用モデルとして、高性能に仕上がっています。その強力さは、追加学習用のLoRAを作成すると、さらに明確に分かります。これまで、GPT Image 2.0などのクラウドモデルでは実現できていましたが、ローカルPCで使えるオープンモデルでは、複雑なキャラクターの一貫性を保つのが難しい状況でした。その限界を突破する存在になりそうです。

ComfyUI共同開発のアニメ系モデル「Anima」

 Animaは、ComfyUIから資金提供を受けている米Circle Stone Labが、1月からプレビュー版の公開を開始し、毎月のようにアップデートを重ねてきました(参考:ComfyUI、画像生成AI「Anima」共同開発 アニメ系モデルで“SDXL超え”狙う )。Anima Base v1.0は、ベースとなる完成版モデルで、学習が進んだことで、Preview版にあったノイズ感はほとんど解消されており、クリアな画質で出力できます。モデルサイズは4.18GBと大型化が進む近年のモデルの中では小さく、ビデオカードのVRAMが8GBでも動作します。しかし、解像度は一般的な1024x1024よりかなり大きい1536x1536までサポートしています。筆者のA6000搭載(RTX 3090に相当)では、1024x1024の画像を1枚生成するのに、約30秒かかります。

Animaで同じプロンプトで作った画像。毎回微妙にタッチや顔が変わってしまい、一貫性を保つのが難しい

 Animaでクリアかつ品質が高い画像が出せるのはいいのですが、弱点もあります。生成するたびに、画風が大きく揺れるのです。同じプロンプトであっても、キャラクターの雰囲気はかなり変わってしまいます。プロンプトだけで制御するのは難しいようです。そこで効果を発揮するのがLoRAです。Animaの画像の揺れを抑制し、自分の意図する画像へコントロールしやすくなるのです。 Anima用のLoRA作成環境は、日本人技術者のKohya Tech(@kohya_tech)さんが継続的に開発を続けている世界的なデファクトスタンダードの一つである「sd-scripts」が、2月にAnimaをサポートしました。それをgazingstarsさんがGUI化し、使いやすくした「Anima Standalone Trainer」として公開しました。

Anima Standalone Trainerの画面。各パラメータ設定がわからないときは、AIに相談するのが手っ取り早いのでお勧めしたい

前へ 1 2 3 4 5 次へ

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
ピックアップ