ボーカルと楽器の演奏を自動分割する「Stem Splitter」
iPadのためのLogic Pro 2が新しく搭載する、もうひとつのAIベースの機能が「Stem Splitter」です。
さまざまな楽器による演奏がミックスダウンされた音源から、ボーカル、ドラム、ギター、その他の音源という4つのパートを分類して、個別のトラックに復元するという神業的な機能です。iPadのLogic Proに収録されているデモンストレーションの音源からStem Splitterの効果がよくわかります。
こちらも使い方はとても簡単。Logic Pro 2のアプリに取り込んだ音源をタップで選択して、メニューリストに表示される「Stem Splitter」を選択します。ポップアップメニューからは分割する4つのパートが選べます。
アップルはStem Splitterについて、多くのミュージシャンが本番のセッション以外の場面で残したテープから、会心のパフォーマンスを分離、復元して新しい作品の制作に活かす用途などに使ってもらいたいと説明しています。
友人のバンドが演奏したMP3形式の音源をLogic Proに取り込んでStem Splitterをかけてみました。元の楽曲構成の複雑さにもよりますが、提供してもらった3分前後の音楽ファイルが、M4搭載iPad Proなら4つのパートをフルに選択した状態で約8秒かけて分割を完了しました。
AIによる音源分離は驚きの切れ味です。ボーカルはまるで無響室で録音した音源のようで、楽器による演奏が背景に混じって聞こえるようなことが一切ありません。ベース、ドラムスの演奏も見事に分離されています。ギターとキーボードの演奏は「その他」の音源に分類され、ひとつのトラックにまとめられました。分類できる楽器の種類を増やしたり、複数のボーカリストが歌うユニットの声を選り分けて分離するところまではできませんが、おそらくアップルはもう「次の一手」として課題に取り組んでいることでしょう。
これほどまでに高い精度で音源を分離できれば、マイケル・ジャクソンの楽曲『Love Never Felt So Good』のように、アーティストの歴史的作品をデジタル技術を駆使しながら再度マスタリングしたり、個別のトラックを素材として活かすリミックス作品もつくりやすくなりそうです。
音楽配信サービスのApple Musicでカラオケが楽しめる「Apple Music Sing」も、アップル独自の機械学習処理によってボーカルとバックトラックの音源を分離する技術です。AirPods Proが搭載するノイズコントロールに含まれる「会話感知」も同様。人の声を選り分けて聴きやすくする機械学習由来の、つまりは「AI機能」に分類できます。人の声だけでなく、楽器の種類を選り分けることにAIパワーを割いて、音楽クリエイターをサポートする機能を形にしたところにStem Splitterの意義があると筆者は思います。
最後にiPadとMacの新しいLogic Proに搭載された「ChromaGlow」は、スタジオ用ミキシングコンソールのサウンドを、Appleシリコンと機械学習のパワーにより高品位にモデリングするプラグイン機能です。ミキシング作業の際、ChromaGlowを使えば音源にいっそう豊かな音色を加えることができます。