動画に自動で効果音をつける技術も登場
もうひとつ、年末に面白いものが出ていました。米イリノイ大学とソニーによる、「MMAudio」という研究です。動画生成AIの弱点は、生成した音声が無音であることでした。それに効果音をつけていくことは動画編集ソフトを使い、効果音を別に作成したりして設定する必要があるため手間がかかります。MMAudioは、動画を解析して、動画の動きに合わせて効果音を生成してくれるのです。WebUI環境のGradioで動かすことができるのですが、操作も簡単で非常に使いやすいです。権利もMITライセンスと使いやすいものです。すでに作例で触れている動画は、すべてこのMMAudioでつけた効果音です。
実際に生成していると、生成時間も短く、手軽に動画に音をつけるにはこれで十分ではないかと思わせます。例えば、以前に作例で紹介した、雨の坂を下っていく10秒の動画に音をつけてみました。プロンプトには「雨、足音」と指定しています。生成時間は7秒程度で雨音と足音が動画に追加されました。それがつくだけで、没入感が劇的に変わります。
この技術は、今後様々な動画サービスに統合されていくのではないかと思えます。
▲MMAudioで効果音をつけた状態の動画
本記事はアフィリエイトプログラムによる収益を得ている場合があります

この連載の記事
-
第158回
AI
SDXLの次はこれ? アニメ特化のローカル画像生成AI、驚きの実力 -
第157回
AI
AIだけでゲームは作れるのか? Codexに7本作らせて見えた実力と限界 -
第156回
AI
ChatGPTの画像生成AIは本当に最強か Nano Bananaと比べて見えた“弱点” -
第155回
AI
非エンジニアが数百万円級のツールを開発 画像&動画生成AIツールがゼロから作れた話 -
第154回
AI
ChatGPTの画像生成AIが強すぎる AI画像が世界中に氾濫する時代へ -
第153回
AI
ChatGPTの画像生成AIが「Nano Banana」超え? 漫画や動画風カットが実用レベルに -
第152回
AI
Seedance 2.0×AIエージェントでAI動画が激変 “AI脚本家”や“AI絵コンテ作家”との共同作業で、アニメ制作が身近に -
第151回
AI
画像・動画生成AIの常識が変わる、Claude Codeに全部やらせる方法論 -
第150回
AI
無料でここまで? 動画生成AI「LTX-2.3」はWan2.2の牙城を崩すか -
第149回
AI
AIと8回話しただけで“性格が変わる” 研究が警告する「おべっかAI」の影響 -
第148回
AI
AIが15万字の小説を1週間で執筆──「Claude Opus 4.6」が示した創作の未来 - この連載の一覧へ






