アリババは9月24日、動画生成AIモデル「Wan」最新プレビュー版「Wan 2.5-Preview」を発表した。1080p HDレベルの解像度でおよそ10秒の動画を生成できる。公式サイトで試用可能だ。
テキスト、画像、音声、映像など、複数のモードを統合的に処理するマルチモーダル性能を備えた。ギターを弾いたり、口の動きに合わせて歌を歌ったりするような動画を生成できる。
また、人間のフィードバックを取り入れた強化学習(RLHF)を導入し、好まれやすい品質と表現を可能にした。さらに画像の編集能力も向上しており、様々な画風への変更や、文字のレンダリング、色彩の変更などにも対応し、活用の幅が広がった。
すでにアリババから関係各社向けにAPIが提供されており、画像生成ツールのComfyUIや、Fal、WaveSpeedなどのAIプラットフォームを通じて利用できる。
— Wan (@Alibaba_Wan) September 24, 2025







