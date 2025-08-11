新清士の「メタバース・プレゼンス」 第119回
無料の動画生成AI「Wan2.2」が凄すぎる PCローカルでこの品質が出せるとは
2025年08月11日 07時00分更新
7月28日に公開された中国・アリババの動画生成AIモデル「Wan2.2」がすさまじい性能を発揮しています。ローカルPC環境で利用できるオープンモデルとして公開されましたが、ヘタな商用AIクラウドサービスを超えていると感じさせるほど、高品質なAI動画が生成可能です。2月リリースの「Wan2.1」でも高い評価を得ていましたが、それを遥かに超えており、業界を席巻しそうな雰囲気を感じました。
※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください
実写もアニメも高性能
Wan2.2の性能の高さは触れば触るほどわかってきます。カップ麺、箸、麺など、複数のオブジェクトが関わるため、画像や動画生成AIでは一般的に苦手といわれてきたテーマであっても、破綻なく描写ができます。対象物との関係性が問われる銃を撃つアクションをさせてみましたが、こうした課題も見事に乗り越えています。どちらも、過去この連載で作成した作例モデルキャラの「明日来子さん」を最初の画像に指定して、i2v（Image-to-Video、画像からビデオ）により生成しています。
△明日来子さんが、カップラーメンとハンバーガーを食べている動画。作成はWan2.2 I2V-A14B（後述）を使用。効果音は動画に合わせて任意の音を付けてくれる「MMAudio」で作成（以下、同じ）
△明日来子さんが、銃とライフルを構えて発砲する動画。撃った後にニヤリとしたり、背後の人が振り返って見ているのは、プロンプトで指定している
実写系だけでなく、アニメ系など、画風が異なるものでも描写力は高いです。複雑なプロンプトを認識できるようで、対象物、動き、美的なニュアンス、ライティングを詳しく記述すると、それに合わせて忠実に動画が生成されます。プロンプトは英語と中国語で記述する必要がありますが、公式なアナウンスはされていないものの、日本語も認識します。ただしプロンプトとしては、ネイティブ言語の中国語が最も効果が大きいという報告もあります。
△アニメ・イラスト系の作例いろいろ。ベース画像はMidjourneyで作成し、Wan2.2 I2V-A14Bを使用し、832x480で作成
