実際に試しに使ってみた。サンプルとして用意された「重厚なドラムとシンセパッドをバックにした、80年代のドライビングポップソング」とバッハのメロディを組み合わせたものと、テキストプロンプトのみの出力結果を挙げる。注記しておくとこれはMusicLMのようにあらかじめ用意されたサンプルではなく、私がMusicGenに指示を出して出力した結果だ。
参考音源付きの生成結果
テキストプロンプトのみの生成結果
ちなみに両出力結果とも同じテキストプロンプトから生成しているが、曲自体が異なるのは、MusicGenがほかの生成AIのようにランダム性を持っているからだと推測できる。ChatGPTにおいて同じ質問をしても同じ回答はしないのと同じだ。
次に独自の文章指示プロンプトを試してみるため、「静かなパートと力強いパートが交互に現れ、ドラマティックな展開となるシンフォニックプログレッシブロック」といささかマニアックな指示をしてみた。出力結果がこれだ。
プログレ風の楽曲を指示した生成結果
聞いてみるとたしかにプログレっぽいのが分かる。12秒に過ぎないが、静かなパートと力強いパートも交互に現れている。曲調はキング・クリムゾンを思わせるが、もしかすると元のストック音楽データにはクリムゾンフォロワーのようなバンドが多いのかもしれない。しかし、これは推測に過ぎない。
音楽生成AIでは著作権問題がもっとも問題になると思われるが、学習する際にライセンスに問題がない音源を使用すること、ダウンサンプリングをしているらしいこと、生成にランダム性が加わることでこの問題には一定の対策は打てているように思う。
メタはAIに注力していて、最近ではチャットGPTなどの生成AIを過去のものにするという斬新なアーキテクチャを持った「I-JEPA」というモデルを公開している。
I-JEPAはいわゆる究極のAIと呼ばれるAGIではないが、普通の生成AIよりも汎用性が高く、学習にノイズを使用しないという点が新しい。つまり細部ではなく、大まかな点に着目して学習して、推測するというモデルのようだ。
こうした成果も取り入れながらも、音楽生成AIが更なる進化を遂げる日もそう遠い将来ではないのかもしれない。
![](/img/blank.gif)
この連載の記事
-
第290回
AV
HDTracksがMQA技術を使ったストリーミング配信開始へ -
第289回
AV
TIDALがMQA配信から撤退、すべてFLACに──360 Reality Audioも聞けなくなる -
第288回
AV
「AirPods Proの“会話を検知”だけじゃ不十分」──ワシントン大学が凝視するだけで相手の声を抽出する新技術 -
第287回
AV
Roon ARCがCarPlayやAndroid Autoに対応、車内で音声操作を -
第286回
AV
MQAに新動向、MQA技術の先にある「AIRIA」「FOQUS」「QRONO」とは? -
第285回
AV
新感覚のオーディオイベント「REB fes」を体験、自分だけのストーリー実現に悩もう! -
第284回
AV
JBLによる2つの新提案「LIVE BEAM 3」と「Fit Checker」を体験してきた -
第283回
AV
グーグル、プロも驚く音楽生成AI「Music AI Sandbox」を開発 -
第282回
AV
液晶をタッチして操作する、Volumioの新ネットワークプレーヤー「Motivo」 -
第281回
AV
HIGH END Munich 2024出展製品から、気になるエントリーオーディオをセレクト -
第280回
AV
水月雨がオーディオファン向けスマホを開発、複雑になりすぎたスマホ高音質再生への問いかけ - この連載の一覧へ