このページの本文へ

新清士の「メタバース・プレゼンス」 第158回

SDXLの次はこれ? アニメ特化のローカル画像生成AI、驚きの実力

2026年05月25日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

ControlNetがない問題を“Any”方式で解決

 Animaには、まだ公式の「ControlNet」が提供されておらず、今後公式サポートされるかどうかも明らかにされていません。Image-to-Image(i2i)には対応しているものの、ポーズなどの誘導に使うには課題がありました。

 5月20日に、Kohya Techさんが「Anima-LLLite」の最新版「anima-lllite-any-test-like-v2.safetensors」を公開したことで、一気に解決しました。大きな特徴は、ライン抽出(LineArt)や深度推定(Depth)といった機能にも対応する一方で、Anytest方式という汎用性の高い方式を採用していることです、画像データを直接入力することで、その画像の色味まで反映した生成を実現している点です。

 作例では、右側の写真風の画像を、Anima-LLLiteに入力データとして使い、Animaで出力した結果が左側の画像です。プロンプトは、写真画像をLLMで解析して作成しています。そのため、非常に雰囲気の近い画像を作ることができています。

 もちろん、これにLoRAを組み合わせることで、キャラクターLoRAの特徴に近づけていくことができます。田中さんLoRAは素直に似ていますが、複雑なデザインのアスレナさんでは簡単には出力できていないため、パラメータ設定には工夫が必要な場合もあります。

Anima-LLLiteの適用後(左)、オリジナル画像(右)

Anima-LLLiteと田中さんLoRAを適用した結果(左)、アスレナさんLoRAを適用(右)

 今後、Baseから派生した軽量版などが公開される可能性があります。すでに、ユーザーによって既存の高速化テクニックを使って開発された「Turbo LoRA」が公開されており、これを使うと、通常生成では35ステップ(内部で画像生成を繰り返す回数)程度が推奨されていますが、10ステップで済むため、生成時間は10秒程度まで短縮できます。

 ただ、Turbo LoRAを使った場合には、LoRAが効きにくくなる傾向があるようです。Turbo LoRAを適用して作例をもう一度生成し、LoRAとControlNetを適用した例では、少し形状が単純化されています。アスレナさんでは、服のデザインがかなり変わっています。時間短縮には便利なのですが、うまく使い分ける必要がありそうです。

Turbo LoRAを適用した結果。高速に画像が生成されるが形状が単純化されたりする傾向はある

 また、すでにコミュニティから、本格的な派生モデルも登場しています。おれおん(@oron1208)さんが、5月20日に公開した「OOO_Anima」は、萌えアニメ・イラストの画像、約5万3000枚で追加学習しています。その特徴として、1920x1920というフルHDを超える大きなサイズまでサポートしています。

OOO_Animaで1920x1920で出力した結果、ディテールが増している

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
ピックアップ