音楽の世界でも広がる生成AI
生成AIが注目される流れは、画像や文章だけではなく音楽にも波及している。例えば、5月にSpotifyがAIで生成された数万曲を削除したというニュースがあった。これは著作権のほかにも、ビジネスモデル的な課題があるということを示している。
実際探してみると、AIが音楽を作成するというサービスは意外に多い。しかし先日紹介したグーグルの「MusicLM」のように長いプロンプト(指示文)を使用して曲の生成を指示できる音楽生成AIは探してみてもあまり見つからない。MusicLMはベータ版の運用を拡大しているが日本は対象外だ。
そうした中で、先日メタ(旧フェイスブック)が、MusicLMに似た音楽の生成AIプラットフォーム「Meta MusicGen」を発表した。メタも、(アップルを除く)ほかのテックジャイアント同様、AIに焦点を合わせてきている。その一環でもあるのだろう。
MusicGenの特徴
GitHubやHugging Face(AIコミュニティ)でのメタの解説によると、MusicGenは自己回帰トランスフォーマーモデルを使用しているとある。これはChatGPTと同じトランスフォーマー型AI、つまり生成AIのことであり、自己回帰型というのは生成AIにおいて出力を次のステップの入力とすることで長い出力を生成できるタイプのことを言う。ChatGPTで小説のような長い出力が可能な理由は自己回帰型だからである。MusicGenも同様に長い音楽を生成可能と思われるが、現在は12秒に制限されている。
学習に関しては、32kHz EnCodecトークナイザーを使用して訓練したとある。ChatGPTがテキストを用いて学習するのと同様に、MusicGenでは32kHzのトークン(最小単位)にエンコードされた音楽データを学習したということになる。よくAIでは「学習データがそのまま出てくる」と言われることもあるが、普通はデータ量を削減するために、元データをそのまま使うことはない。例えば画像生成AIなどでは元画像の中央の矩形領域のみを学習に使用するのが一般的だ。これは画像生成AIが4隅の生成に弱いとされる理由でもある。
MusicGenにおいても元データはおそらく44kHzか48kHzだと思われるが、データ量の関係で32kHzにエンコードしているのかもしれない。あるいはダウンサンプルするのは著作権対策のためとも考えられる。
どういうデータを用いて学習したかということが注目ポイントの一つであるが、「MusicGen」では2万時間に及ぶライセンスされた音楽を使用したとある。このライセンスされた音楽というのは、具体的にいうと「ShutterStock」や「Pond5」のようなストック音楽を提供するサービスのようだ。
テキストでの指示に加え、音楽サンプルの添付もできる
MusicGenのユニークな点は、文章でのプロンプト指示のほかに音楽自体をプロンプトとして使用できるという点だ。例えば「重厚なドラムとシンセパッドをバックにした、80年代のドライビングポップソング」を“バッハのメロディ”で作成するということができる。この場合、バッハの音楽はMP3ファイルなどをアップロードする。
MusicGenのコードなどの詳細はGitHubで公開されているが、デモとしてHugging Faceのウェブページで簡単に使用することができる。これは日本からも使用ができる。先にも書いたように現在「MusicGen」は12秒の音楽を生成することができ、出力はMP4形式となる。
この連載の記事
-
第276回
AV
Amazon Musicも生成AIを使ったプレイリスト作成機能提供、あいまいな指示に応える -
第275回
AV
ソリッドなステンレス筐体とK2HDサウンド、iFi audioの「Go bar 剣聖」 -
第274回
AV
いよいよSpotifyもロスレス配信か、Redditに解析情報 -
第273回
AV
ソニーが米国で展開し始めた、重低音新シリーズ「ULT POWER SOUND」とは? -
第272回
AV
自然な文章でプレイスリスト作成をうながせる、Spotifyの新機能 -
第271回
AV
音楽生成AIの進化速度に舌をまく、無料でも試せるStable Audio 2.0を使う -
第270回
AV
耳をふさがないイヤホンで高音質を追究したい人に、Cleer Audioがいいぞ!! -
第269回
AV
期待が高まる「Fokus Triumph」の音、NobleのMEMSスピーカー搭載イヤホン第3弾 -
第268回
AV
XPAN技術やWi-Fi 7、UWBなどをAIで統合した、クアルコムのFastConnect 7900 -
第267回
AV
K2HDに対応、個性的な機能備えたiFi audioのスティック型USB DAC「GO bar剣聖」 -
第266回
AV
日本とは異なる趣を持つ、ドイツのヘッドホンイベント“The World of Headphones” - この連載の一覧へ