このページの本文へ

新清士の「メタバース・プレゼンス」 第112回

楽曲生成AIの進化が凄い 鼻歌からプロ級の曲がポンポンできる

2025年06月23日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

ChatGPTの歌詞でラブソングにする

 ChatGPT(GPT-4o)に「AIのラブソングをテーマにした歌詞を作って」と指定して、歌詞を作ってもらいました。日本語で作詞したあと、「サビの部分では英語を使うように」と微修正を指示しています。複数のLLMで作詞を試しましたが、今のところ、ChatGPTが曲にしたときに最も自然な作詞をしてくれる印象です。

 それを今度は「Lyrics(歌詞)」に入力します。プロンプトを画像で紹介したテクノ風ポップソングを狙った設定にしました。そして、Weirdness 16%、Style Influence 41%、Audio Influence 100%としました。あまり奇抜な展開になりすぎないようにして、プロンプトの影響も小さめに、しかし、鼻歌の影響は必ず受けるようにと設定しました。

 これによって完成した曲は、鼻歌が冒頭のリズムとして組み込まれ、曲全体を盛り上げるアクセントとして生きています。後半の2分過ぎにも、このリズムは再び使われています。筆者の鼻歌から始まったとは思えないほど、曲としての完成度も高く、普通に聴けてしまいます。MP3データとしてダウンロードし、iPhoneの中に入れてヘビーローテーションで聴くほど気に入りました。

▲筆者のChatGPT(GPT-4o)が作詞した『記憶になりたい』をSunoで曲をつけたもの

 さらに今度は、この曲をリミックスしてみます。今度のプロンプトは「duet, female vocal, jazz, piano, techno, acid jazz, classic, clear voice, lo-fi」のようにして、生演奏に近いような楽曲を目指します。Weirdness 71%、Style Influence76%、Audio Strength: 23%として、元の楽曲からかなり自由に変わることも認めます。そして、出てきたの曲は下記です。メロディラインを維持しながらも、まったく違った雰囲気の曲になっています。

 これらの曲は、生成を始めると15秒程度で聞けるようになり、3分程度で完成します。ただ、かなりランダム性が高く、細かいコントロールはほとんどできず、どんな曲が生み出されるのかは生成してみなければわかりません。かなり、ガチャ性が高いとも言えます。

 1回の生成で2曲作られるのは、複数のパターンを出すことで、「当たり」と感じてもらえる回数を増やすためではないかと思います。実際、今回紹介した曲以外に多数の没ソングが存在しており、30曲あまり生成しています。10曲程度作ると、その中にお気に入りの1曲が出てくる印象ですが、1回あたりのコストが比較的安いこともあり、満足度が高いです。

カテゴリートップへ

この連載の記事
ピックアップ