画像をAIで生成することが当たり前になった現代だが、音楽もAIで生成できることはご存じだろうか。
SunoというAIサービスを使うと、素人が聞くにはかなりクオリティの高い楽曲が生成される。
音楽ジャンルもなんでもござれ。インスト楽曲も、日本語のボーカルあり楽曲もOKだ。
先日「存在するはずのないAI生成のシティポップ楽曲で記憶が改ざんされていく」というXのポストがバズったが、筆者が聞いてみた限りではそのAI生成楽曲もSunoで生成したものだと思う。
▲話題になったAIシティポップ
筆者は普段DTMといわれる、パソコンで曲を作ることをしている。
DTMとはデスクトップミュージックの略だが、和製英語らしい。
もともと音楽を作るのは好きで歌うのも好きなので、オリジナルソングを作って歌って発表している。
▲こんな曲を作っています
しかし、曲を作るのは大変なんである。たのしいけど。
歌詞もかけなくてうなっているのである。
そこで、ハタと気づいた。
AIに曲作ってもらったら即つくりたい感じの曲できるんじゃね?
テクノロジーとのインタラクションをテーマに活動している筆者にとって、AIとの対話は大変興味深い領域である。
AIと対話しながら曲を作ってみたい。
AIで作曲する方法
考えたフローは以下である。
フロー1
1.文章生成AIに歌詞を書いてもらう
2.その歌詞をSunoに入れて、AIで曲にしてもらう
3.DAW(パソコンで音楽をつくるソフト)でAIが作った曲を作り直す
4.歌を収録して載せる
5.ミックス・マスタリングをする
調べたところ、Sunoは課金をすれば商用利用可になるらしい。完成した曲を有料でリリースしても大丈夫になりそうだ。
生成した曲をそのままリリースするのではなく、DAWで打ちなおす工程を挟んでいるのは、Suno独特のカスカスした音色がいやでもっといい音でリリースしたいと思ったのと、自分で歌いたいのでオフボーカルの音源が必要だからである。
Sunoには歌詞を入力してそれを歌ってもらう機能がある。
事前に文章生成AI(今回はChatGPTを利用)に歌詞を書いてもらって、それをSunoに流し込めばその歌詞で曲を作ってくれるはずである。実際にやってみて、フローを変更する必要もあり、以下のようになった。
フロー2
1.文章生成AIに歌詞を書いてもらう
2.歌詞を自分のいいたいことにリライトする
3.その歌詞をSunoに入れて、AIで曲にしてもらう
4.たくさん生成した曲の中から一番いいと思うものを選ぶ
5.コード解析アプリで楽曲のコード進行を確認
6.DAW(パソコンで音楽をつくるソフト)でAIが作った曲を作り直す
7.歌った時の語感に合わせて歌詞を(だいぶ)リライトする
8.歌を収録して載せる
9.ミックス・マスタリングをする
AIが作った曲はサウンドとしてはかっこよかったりするのだが、歌詞とメロディの語感の良さは低い印象だった。
そのため、曲をつくってメロディが決まった後にメロディに合わせて語感がいいように歌詞を書き換える必要があるなと感じた。
しかし、歌詞の雰囲気は曲に反映されているので、最初にChatGPTに歌詞を書いてもらったのは意味があった。
最初にChatGPTに書かせる歌詞は、「曲の雰囲気を伝えるための歌詞」と割り切った方がいいのかもしれない。
以下のようなアウトプットが今回はできた。フロー2の6まで進んだ。6の歌詞のリライトやボーカルのレコーディングはできていない。
▲Sunoで生成した楽曲そのまま
▲DAWでトラックを打ちなおしたものの途中
歌詞の1番と2番で文字数が合っていなかったので、1番AメロBメロと、2番AメロBメロが違う感じに生成されてしまった。そこでサウンドとメロディは2番のものを採用し、1番も同じ様にして歌詞のほうを書き直すことにした。
以下では、実際に制作した際のスクリーンショットを含めて解説していく。
ちなみに1から5まではすべてスマートフォンで完結してしまってパソコンを使わなかった。電車の中でも音楽生成ができるなんてすごい時代だ……。
ChatGPTで歌詞を書いていく
最初は、ChatGPTを使って歌詞を書いていった。ちなみに数ある文章生成AIの中でChatGPTを使用したのは、一番メジャーな文章生成AIなので、「作詞:ChatGPT」と書いたときにちゃんと伝わるだろうと思ったからである。
最初に、「こういう歌詞を書きたい」というのをざっくりとディレクションして書いてもらった。
こういう歌詞を書きたい、というイメージが自分の中で言語化されるいい体験である。
ChatGPTが歌詞を書いてくれた。うーんださい。
これに対して、「このワードがださいです」「こういうイメージの歌詞を入れてください」など指示を飛ばしてブラッシュアップしていく。
気づいたこととして、ChatGPTに「カタカナを使って」というと、カタカナを使いすぎてしまう。つまり、指示した内容を少し入れ込むのではなく過剰に入れ込んでしまう。
そこで、「20%こういうワードを使ってください」「15%このイメージの歌詞を入れてください」などと量を指示するようにした。
バランスの取れた歌詞を作るには、定量的に指示する必要があるようだ。
いい感じになったChatGPTの書いた歌詞だが、やはり筆者の表現したいこと、言いたいこととはちょっと違うので、リライトしていく。
表現を変えたり、意味合いが被っているところを調整したり、コール&レスポンスっぽいところを入れてみたりした。
完成した歌詞をSunoに入れ込んで曲にしていく
一旦完成した歌詞を作曲AIのSunoに入れ込んで曲にしていく。
前述のとおりSunoには歌詞を入れ込むところがある。
歌詞を入れ込んで、歌あり曲の設定にして、曲のジャンルを指定していく。
今回は、VOCALOID曲っぽい踊れるダンス女性ボーカルJ-POPにしたかったので、「Gachapop, J-POP, EDM, dubstep, VOCALOID, female」などを組み合わせて工夫して何回も生成していった。
大量に生成した曲の中でピンときた曲があったので、それを元に曲を作ることにした。
▲この曲である
マイナー調でEDMっぽいのがかっこいい。この曲をDAWで打ち込んでいく。
楽曲からコード進行を読み取り、DAWに打ち込んでいく
コード進行を耳で聞き取る自信がなかったので、楽曲からコード進行を自動で読み取ってくれるアプリ、YAMAHA「Chord Tracker」を使ってコード進行を解析していく。
これが完全に正しいわけではないが、ヒントにはなるのでこれを見ながらDAWで入力していく。音楽のほうのキーボードを使って、パソコンに曲を打ち込んでいく。
AIですでに作ってある曲があるので、シンセサイザーなどの音色の選び方に指標があってとてもやりやすい。さらに、筆者が今まで使ったことなかったドラムのリズムなどもあり、とても勉強になる。
こうして、大体DAWでの入力が完了した。
この連載の記事
- 第319回 歌声合成ソフト「UTAU」でオリジナルキャラを歌わせてみた
- 第317回 ものづくり版コミケ「Makerフェア」2024年は面白かった。出展者の世代交代もなされているように見えた
- 第315回 0歳児、いつから保育園に? 女性の働き方、とことん考えてみました
- 第315回 推しの細胞がついた指輪を作ってもらった
- 第314回 おしゃれすぎるファン付きウェアを買って重要な問題に気付いた
- 第313回 0歳児がいながら、働く。ベストなやり方は?
- 第312回 パートナーの反対で転職できない問題
- 第311回 YouTubeの再生を止めないために画面を自動でタップする機械を作った
- 第310回 地方に移住したいが、東京にとどまるべきか
- この連載の一覧へ