このページの本文へ

新清士の「メタバース・プレゼンス」 第122回

動画生成AI「Wan2.2」の進化が凄い アリババが無料AIモデルの牽引者に

2025年09月01日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

使い分け戦略:FunControl×S2Vで制作を最適化

 FunControlとS2Vの2つのモデルは、Bilibiliなど中国のSNSコミュニティでは高い期待を集めています。ミュージックビデオなどの動画をより作りやすくなったと考えられているためです。キャラクターがカメラから離れたカットではFunControlを使い、近い重要なカットではS2Vを使ってリップシンクを使うといった使い方ができるのではと提案されています。

 Wan2.2シリーズは描画能力の高さは評価を得ていますが、生成時間が5秒を基準に学習がなされています。そのため、Wan2.2で最終フレームを指定していても、5秒を超えると、最初のフレームに画像を戻そうという動きが自然に出てきます。そのためWan2.1でも、5秒単位でカットを切り替えて全体のビデオをとしてつなぐという方法が取られてきたのです。

 しかし、FunControlはそうした制約を崩してくれます。S2Vを短めのカットでつなぐ形でリップシンクした状態を組み合わせることで、実用的なレベルにすることができるのではというわけです。

 Wanシリーズの評判は高く、2月にWan2.1を公開して以来、7月末にはHuggingFaceと中国ModelScopeを中心に累計約500万ダウンロードだったのが、8月27日には、約690万ダウンロードに達したと明らかにしています。この1ヵ月の急増分は、新たに登場したWan2.2シリーズの影響が大きいといえるでしょう。

 Wan2.2シリーズは無料で公開されているものの、ハイエンドのローカルPCであっても、品質と生成時間で考えると、サイズの大きなモデルであり、多くのユーザーはクラウドで利用することになるでしょう。アリババはAPI収入を見込んでの展開を進めていると考えられます。一方で、ライセンス条件は使いやすいApache-2.0を採用し、使用時に厳しい制約もないため、高い支持を集めています。ユーザーコミュニティ形成で優位に保つことで、改良を積極的にする先端のユーザーイノベーションを取り込めると同時に、国際展開を有利に進めようという意図を感じます。

カテゴリートップへ

この連載の記事
ピックアップ