このページの本文へ

新清士の「メタバース・プレゼンス」 第98回

動画生成AIの進化がすごい 「超リアル」「ローカルで動く」2つの方向に

2025年03月10日 07時00分更新

文● 新清士

  • お気に入り
  • 本文印刷

コミュニティベースで機能も充実

 ただ、コミュニティでは生成の高速化の手法がすでに開発されています。ComfyUIの高速化技術を発表し続けているkijaiことユッカ・セッパネンさんが開発した「ComfyUI-WanVideoWrapper(ラッパー)」です。この技術を使うと、生成速度が半分以下に短縮化が実現されます。この環境を組み込んだオールインワンの環境も登場しています。日本人開発者のZuntanさんが9日に発表した「EasyWanVideo」は、Wrapper環境まで含めた統合環境が用意されており、導入がしやすくなっています。試してみたところ、これまで2秒の生成に10分かかっていた環境が、5秒の生成に3~5分で生成できるようになり、使い勝手が劇的によくなりました。「EasyWanVideo」はアダルト系のコミュニティに近いこともあり、サンプルにはそうした動画をLoRAと組み合わせることで作れることの説明もなされています。

△ZuntanさんのEasyWanVideoのアナウンス。ただし、比較的簡単とはいえ導入時にそれなりに専門知識は必要

▲画像AIで作ったアニメ風画像をEasyWanVideoで動画生成したものをつなげたもの。動きは小さめにしたほうが成功する確率は高い。音楽はSunoを使用

 こうした強力なオープンな動画生成AIが登場する背景には、Runway、Klingなどのすでに評価を集めている動画AIサービスに比べて後発であるため、開発者のコミュニティを巻き込むことで、エコシステムを形成して、技術的に追いつく速度を上げようという意図があるものと思われます。それぞれの動画生成AIは、機能的にもまだまだ足りていません。実際、ユーザー主導で、高速化や追加学習のLoRA環境の整備が進んできていることから、企業単得の開発では到達できなかった技術の組み込みが始まっていると言えます。

 例えば、いま動画生成AIサービスにとって性能のレベルの高さを競うポイントになっているのが、キーフレームです。これはi2vのように最初の画像を指定するだけではなく、最後の画像を指定することで、そこに至る動画を生成させることで、より動画のコントロール性を上げる手法です。現在は、Kling v1.6や「Luma Ray2」が搭載しており、高い効果を生み出しています。これに似た機能をLoRAで実現できないかと開発されたのがウェブトゥーンの開発会社のDashtoonが公開した「hunyuan-video-keyframe-control-lora」です。このLoraを使うことで、HunyuanVideoにキーフレームを実現することができます。Loraのトレーニング方法も公開されており、派生技術としては有用性の高いものです。

△キーフレームLoRAの紹介、1枚目が最初で、2枚目が最後で、3枚目の動画を生成している

 これらの動画AIは自社のクラウドサービスでも展開されると同時に、サーバのレンタルサービスにも組み込まれています。ローカルで動作させることができない人であっても、こうしたサービスを使うことで十分に試すことができます。ただし、代表的なFal.aiでは1回の生成に0.4ドルかかります。クラウドサービスの場合は1回日本円で30~70円程度であるため価格的な優位性はそれほどあるとは言えません。ただ生成するコンテンツ内容については、管理しないスタンスを取っているため、基本的に表現できるものに倫理制限は入りません。そうした点を、魅力的な点と考える人もいるかもしれません。

カテゴリートップへ

この連載の記事
ピックアップ