アリババグループの通義研究所が2月にオープンモデルとして公開した動画生成モデル「Wan 2.1」の性能がめちゃめちゃ高いことがわかってきました。一貫性が高く、また、柔軟性も高く、LoRAといった追加学習データとも組み合わせても、素直にデータを反映するとの評価が高まっています。ユーザーが技術開発に関わることで、多数の新しい表現の可能性を模索する動きが登場しつつあります。ローカル環境で動かす動画AIでは、商用クラウド並の水準の動画が作れないという常識がひっくり返され、動画生成AIにStable Diffusion登場時に近いようなインパクトをもたらしつつあります。
※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください
圧倒的に性能が高い「Wan 2.1」の衝撃
▲ファンタジー風の戦車を動かしている動画
Wan 2.1の性能の高さを物語るのが、この動画です。ファンタジー風の戦車を描いた1枚の画像を、前進させ、砲撃させ、果ては、方向を変えさせています。もちろん完全ではない部分はありますが、キャタピラーや車輪の動き、さらには戦車の向きを変えても一貫性が維持されています。戦車を描いた1枚のイラストを入れるだけでもしっかり動いており、筆者の印象では、これまで公開されたどのローカル動画生成AIモデルよりも性能が高いように感じられます。これまでローカル用動画モデルの品質が低いという常識が覆されています。
いつも作例として登場する明日来子さんの動画も作ってみました。笑ってみたり、軽く歩いてみたり、ダンスしてみたりと、適当なプロンプト指定で動作させています。また、一度作成した動画は、後述のキーフレーム機能を使って、つなぎの動画を作成しています。筆者のNVIDIA RTX 4090のローカルPC環境では704x528の5秒の動画を生成するのに約8分かかります。全体では、9種の動画を生成しつないでいます。
▲明日来子さんのAI動画もローカルPCでここまで作れるようになってきた

この連載の記事
-
第99回
AI
無料で使えて超高品質、画像生成AIの最新事情 -
第98回
AI
動画生成AIの進化がすごい 「超リアル」「ローカルで動く」2つの方向に -
第97回
AI
AI法案、柔軟規制で国会審議へ 罰則なし“ソフトロー”の狙いは -
第96回
AI
AI生成の3Dデータが実用レベルに近づいてきた -
第95回
AI
月3万円で使えるOpenAIの「Deep Research」 驚異的だが、情報格差が広がる不安も感じた -
第94回
トピックス
1000円あればOpenAIレベルのAIが作れる DeepSeekで注目の「蒸留」とは -
第93回
AI
DeepSeek R1、無料で使えるAIとしては最強クラス -
第92回
AI
動画生成AI、ついにアダルトの扉が開く -
第91回
AI
AIの書いた小説が普通に面白い ChatGPT「o1」驚きの文章力 -
第90回
トピックス
画像生成AIで年賀状 リアルな人物も簡単に - この連載の一覧へ