このページの本文へ

新清士の「メタバース・プレゼンス」 第100回

動画生成AI、革命の兆し 「Stable Diffusion」級の衝撃再び

2025年03月31日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

制御用の「LoRA」も次々に開発

 もう1つ、Wan 2.1用のLoRA製作の環境が整ってきたことも大きいですね。それによって、専用LoRAが次々に開発されています。LoRAの制作環境としては、画像生成AI「FLUX」のLoRAに開発に力を入れていたotrisさんが静止画からWan 2.1用のLoRAが開発できる「ai-toolkit」を公開しており、また、クラウドPCのレンタルサービス「Replicate」に統合されています。otrisさんが自分の顔写真を15枚ほど学習させたデータで作成した動画を公開していますが、どの登場人物もotrisさんらしき顔を出すことに成功しています。

 筆者も、作例動画からスクリーンショットを12枚切り出し、明日来子さんのLoRAを学習させてみました。かかった時間は11分程でした。1分当たり約0.09ドルかかるため約1.1ドル(約150円)ほどかかります。そのLoRAで動画を生成したところ、人物の一貫性を実現することにも、それなりに成功しています。

▲otrisさんが20枚ほどの自分の顔の画像で作成したLoRAを作って作ったビデオ

▲明日来子さんのLoRAでの作例。雰囲気はよく出ている。作成はReplicateのクラウドのComfyUI環境を使い作成したものと、ローカルで作成したものを組み合わせている

 さらに、kohyaさんが開発された「Musubi-Tuner」が対応しました。これは動画も学習させる環境です。すでにGUI版も登場してきています。数秒間の動画を数本学習させることで、効果を発揮します。

 現在、様々な人がこのツールを使って、LoRAの開発に取り組んでいます。エンジニアのとりにくさんは、大きなキャラクターをちびキャラにするLoRAを開発しました。任意のキャラクターの2Dキャラクターを作成するのに使うことを狙っているようです。残念ながら、筆者は設定に詰まってしまい、まだ成功できていません。学習には求められるVRAMが生成以上に大きいこともあり、なかなか扱うのが難しいのですが、レンタルクラウドを使うなど、今後使う人が増えるにつれて、より簡易に実現する方法が見つけられてくると思います。

▲とりにくさんが開発したデフォルメ化LoRA

カテゴリートップへ

この連載の記事
ピックアップ