「YOASOBIの歌の作り方」解説動画も
RVCが公開された後、音声の学習データのやりとりも非常に活発にされているようです。音声AIについての情報を交換するDiscordの「AI Hub」では登録ユーザーは約40万人に達しています。そこには政治家から俳優、声優、シンガーなどの様々な個別に学習したRVCデータのリンク情報が公開されています。
最近、これをさらに進めたような動画も出てきました。7月28日にYouTubeに人気音楽ユニットのYOASOBI風の楽曲の作り方を解説する動画が投稿されました。作成者は海外の方のようです。動画ではYOASOBIの楽曲を分析し、打ち込みで“それっぽい”楽曲を制作。さらに、メインメロディを作った後、楽曲に合うように“それっぽい”日本語の歌詞をChatGPTに作ってもらい、それをボーカロイドを当てはめて歌わせています。
そして、AI Hubで得た情報を元に、ボーカロイドが歌っていた部分をRVCに学習させたYOASOBI風の音声に変更。すると、恐ろしいほどに“YOASOBIっぽい”曲ができてしまうというものです。実際、曲も良くできているので、何も知らずに聴くとYOASOBIの曲と勘違いする人は出ると考えられます。
再生回数は23万再生を超えていますが、動画はメイキング動画であり、単体の曲として配信されていないので、公式動画ではないことは一目瞭然です。しかし、曲の魅力を引き上げているのはYOASOBIの学習データであることは明らかなため、権利的にグレーではないかという印象を受けてしまいます。
日本でも、8月15日からは「AI釈迦」というタイトルで有名な楽曲を歌っている動画が次々に公開され、X(Twitter)上でトレンドになりました。
これは、人気ストリーマーのSHAKAさんの音声から学習したと思われるAIを使って、楽曲を歌わせたもの。作成者は「すべての動画はAI生成によって作られています。実際の人の歌唱ではありません」と説明を付けてますが、非常に自然な出来で、本人が歌っているのではないかと間違えそうになってしまう品質のものです(例:「AIに『インフェルノ』歌わせた様子」)。
技術的なハードルが一気に下がったこともあり、学習させたAIに楽曲を歌わせる「AIカバー」は日本でも人気を集めつつあり、多数のアップロードされた動画を見ることができるようになってきています。まだ、お遊びの延長線上のような段階ですが、より高度化していく姿は容易に想像が付きます。
この連載の記事
-
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 -
第84回
AI
画像生成AI「Stable Diffusion 3.5」性能はものたりないが、自由度が高いのは魅力 -
第83回
AI
リアルすぎてキモい 動画AIの進化が止まらない -
第82回
AI
もはや実写と間違えるレベル 動画生成AI「Runway」の進化がすごい -
第81回
AI
AIイラスト、こうしてゲームに使っています -
第80回
AI
ゲーム開発はAI活用が当たり前になりつつあるが、面白さを作り出すのは人間の仕事 -
第79回
AI
AIが考える“アイドル”がリアルすぎた グーグル「Imagen 3」なぜ高品質? -
第78回
AI
話題の画像生成AI「FLUX.1」 人気サービス「Midjourney」との違いは -
第77回
AI
画像生成AI「FLUX.1」が相当ヤバい LoRAで画風の再現も簡単に -
第76回
AI
「Stable Diffusion」の失敗に学び、画像生成AIの勢力図を塗り変える「FLUX.1」 -
第75回
AI
商業漫画にAIが使われるようになってきた - この連載の一覧へ