アリババグループの通義研究所が2月にオープンモデルとして公開した動画生成モデル「Wan 2.1」の性能がめちゃめちゃ高いことがわかってきました。一貫性が高く、また、柔軟性も高く、LoRAといった追加学習データとも組み合わせても、素直にデータを反映するとの評価が高まっています。ユーザーが技術開発に関わることで、多数の新しい表現の可能性を模索する動きが登場しつつあります。ローカル環境で動かす動画AIでは、商用クラウド並の水準の動画が作れないという常識がひっくり返され、動画生成AIにStable Diffusion登場時に近いようなインパクトをもたらしつつあります。
※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください
圧倒的に性能が高い「Wan 2.1」の衝撃
▲ファンタジー風の戦車を動かしている動画
Wan 2.1の性能の高さを物語るのが、この動画です。ファンタジー風の戦車を描いた1枚の画像を、前進させ、砲撃させ、果ては、方向を変えさせています。もちろん完全ではない部分はありますが、キャタピラーや車輪の動き、さらには戦車の向きを変えても一貫性が維持されています。戦車を描いた1枚のイラストを入れるだけでもしっかり動いており、筆者の印象では、これまで公開されたどのローカル動画生成AIモデルよりも性能が高いように感じられます。これまでローカル用動画モデルの品質が低いという常識が覆されています。
いつも作例として登場する明日来子さんの動画も作ってみました。笑ってみたり、軽く歩いてみたり、ダンスしてみたりと、適当なプロンプト指定で動作させています。また、一度作成した動画は、後述のキーフレーム機能を使って、つなぎの動画を作成しています。筆者のNVIDIA RTX 4090のローカルPC環境では704x528の5秒の動画を生成するのに約8分かかります。全体では、9種の動画を生成しつないでいます。
▲明日来子さんのAI動画もローカルPCでここまで作れるようになってきた

この連載の記事
-
第121回
AI
愛していたAIが消えた日 ChatGPTだけと“付き合う”危うさ -
第120回
AI
ラフさえ描けばイラスト作品ほぼ完成 画像生成AI「FLUX.1 Kontext」LoRAが示す制作の未来 -
第119回
AI
無料の動画生成AI「Wan2.2」が凄すぎる PCローカルでこの品質が出せるとは -
第118回
AI
AIの「ASMRボイス」に脳ゾワゾワ 合成音声の進化と、収益化への課題 -
第117回
AI
“18禁”美少女AI「Ani」は孤独を癒すか、深めるか? -
第116回
AI
AIが書いた怪談小説が面白い 2分に1本のペースで出力されるのは驚異的 -
第115回
AI
“一貫性”がすごい画像生成AI 冬服→夏服も一発変換 話題の「FLUX.1 Kontext[dev]」 -
第114回
AI
Midjourneyの動画生成AIが強い 驚きの高性能で価格破壊 -
第113回
AI
AI丸投げのゲーム開発が超楽しい 誰もがプログラムを作る時代は確実に来る -
第112回
AI
楽曲生成AIの進化が凄い 鼻歌からプロ級の曲がポンポンできる -
第111回
AI
画像生成AI、日本の開発者コミュニティが熱い 世界最先端の “新手法”続々 - この連載の一覧へ