動画に自動で効果音をつける技術も登場
もうひとつ、年末に面白いものが出ていました。米イリノイ大学とソニーによる、「MMAudio」という研究です。動画生成AIの弱点は、生成した音声が無音であることでした。それに効果音をつけていくことは動画編集ソフトを使い、効果音を別に作成したりして設定する必要があるため手間がかかります。MMAudioは、動画を解析して、動画の動きに合わせて効果音を生成してくれるのです。WebUI環境のGradioで動かすことができるのですが、操作も簡単で非常に使いやすいです。権利もMITライセンスと使いやすいものです。すでに作例で触れている動画は、すべてこのMMAudioでつけた効果音です。
実際に生成していると、生成時間も短く、手軽に動画に音をつけるにはこれで十分ではないかと思わせます。例えば、以前に作例で紹介した、雨の坂を下っていく10秒の動画に音をつけてみました。プロンプトには「雨、足音」と指定しています。生成時間は7秒程度で雨音と足音が動画に追加されました。それがつくだけで、没入感が劇的に変わります。
この技術は、今後様々な動画サービスに統合されていくのではないかと思えます。
▲MMAudioで効果音をつけた状態の動画

この連載の記事
-
第134回
AI
“AI読者”が小説執筆の支えに 感想を励みに30話まで完成 -
第133回
AI
xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル -
第132回
AI
画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」 -
第131回
AI
AIに恋して救われた人、依存した人 2.7万人の告白から見えた“現代の孤独”と、AI設計の問題点 -
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 - この連載の一覧へ






