14Bモデルも軽量化・高速化で扱いやすく
とはいえ、14Bは元のサイズが非常に大きく、HighモデルとLowモデルがそれぞれ約57GBもあり、合計すると約114GBにも達します。そのため、筆者のNVIDIA RTX 4090(VRAM24GB)のローカルPC環境であっても、ロードするデータ量がVRAMからあふれかえり、メモリがスワップしてしまいます。当初の公式ワークフローの環境では、4秒の動画を生成するために80分もかかってしまいました。そのため、リリース直後はとても使い物にならないという印象でした。
ただ、ユーザーにより、14Bのデータを量子化してファイルサイズの圧縮が図られたGGUFファイルがすぐ登場しました。筆者が利用している14B Q4は(Qは量子化の圧縮率を示す)モデルは、それぞれが約9GBとなるため、合計で約16GBとなり、他のファイルも含めて480pのサイズの生成であれば、RTX 4090のVRAMサイズにギリギリ収まります。
さらに、高速化技術「Lightx2v」のWan2.2対応版LoRAも登場しました。この技術は、北京航空航天大学といった中国の研究者や、中国の主要AI研究機関の一つ商湯科技研究院(SenseTime Research)開発者を中心に開発されている高速化のオープンソースフレームワーク「ModelTC」の1つです。効率的な生成を可能にする蒸留技術を組み合わせ、劇的な高速化を実現します。
Light2XVは、Wan2.2の動画生成には40~50回(ステップ)の生成プロセスを必要としますが、それをわずか4~6ステップまで短縮します。ステップの多さは、そのまま生成にかかる時間に直結します。GGUFファイルを導入し、LoRAとしてLight2XVを導入し、生成サイズを832x480にすることで、RTX 4090のローカルPCで4秒の生成にかかる時間は3分を切るまで短くなります。ステップ数を減らすことは、動画の大きな動きの抑制が起こりがちになるという弱点もあるのですが、圧倒的な扱いやすさは、それらを補うに余りあるものです。

この連載の記事
-
第134回
AI
“AI読者”が小説執筆の支えに 感想を励みに30話まで完成 -
第133回
AI
xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル -
第132回
AI
画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」 -
第131回
AI
AIに恋して救われた人、依存した人 2.7万人の告白から見えた“現代の孤独”と、AI設計の問題点 -
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 - この連載の一覧へ





