7月28日に公開された中国・アリババの動画生成AIモデル「Wan2.2」がすさまじい性能を発揮しています。ローカルPC環境で利用できるオープンモデルとして公開されましたが、ヘタな商用AIクラウドサービスを超えていると感じさせるほど、高品質なAI動画が生成可能です。2月リリースの「Wan2.1」でも高い評価を得ていましたが、それを遥かに超えており、業界を席巻しそうな雰囲気を感じました。
※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください
実写もアニメも高性能
Wan2.2の性能の高さは触れば触るほどわかってきます。カップ麺、箸、麺など、複数のオブジェクトが関わるため、画像や動画生成AIでは一般的に苦手といわれてきたテーマであっても、破綻なく描写ができます。対象物との関係性が問われる銃を撃つアクションをさせてみましたが、こうした課題も見事に乗り越えています。どちらも、過去この連載で作成した作例モデルキャラの「明日来子さん」を最初の画像に指定して、i2v(Image-to-Video、画像からビデオ)により生成しています。
△明日来子さんが、カップラーメンとハンバーガーを食べている動画。作成はWan2.2 I2V-A14B(後述)を使用。効果音は動画に合わせて任意の音を付けてくれる「MMAudio」で作成(以下、同じ)
△明日来子さんが、銃とライフルを構えて発砲する動画。撃った後にニヤリとしたり、背後の人が振り返って見ているのは、プロンプトで指定している
実写系だけでなく、アニメ系など、画風が異なるものでも描写力は高いです。複雑なプロンプトを認識できるようで、対象物、動き、美的なニュアンス、ライティングを詳しく記述すると、それに合わせて忠実に動画が生成されます。プロンプトは英語と中国語で記述する必要がありますが、公式なアナウンスはされていないものの、日本語も認識します。ただしプロンプトとしては、ネイティブ言語の中国語が最も効果が大きいという報告もあります。
△アニメ・イラスト系の作例いろいろ。ベース画像はMidjourneyで作成し、Wan2.2 I2V-A14Bを使用し、832x480で作成

この連載の記事
-
第133回
AI
xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル -
第132回
AI
画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」 -
第131回
AI
AIに恋して救われた人、依存した人 2.7万人の告白から見えた“現代の孤独”と、AI設計の問題点 -
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 -
第123回
AI
グーグルの画像生成AI「Nano Banana」は異次元レベル AIコンテンツの作り方を根本から変えた - この連載の一覧へ






