佐々木喜洋のポータブルオーディオトレンド 第166回
いま転換を迎えるAIプログラミング
ChatGPTだけではない、「Demucs」に代表されるAIオープンライブラリーが音楽も変える
2022年12月27日 18時00分更新
前回のOPPO「MariSilicon Y」の記事で、OPPOの提唱するパーソナライズ/空間オーディオ技術とは、声や楽器をAIが抽出して、仮想空間に再配置するものだと書いた。このように音楽から声や楽器のパートをAIで自動的に抽出するという技術が最近のトレンドになっている。
Apple Music Sing
例えば、最近アップルがApple Musicに「Apple Music Sing」というカラオケの機能を突然追加して話題となった。これも音源のヴォーカル部分だけを抽出し、音量調節ができることから、同様の技術を使用していると想像できる。また、Apple Music Singにおいては音節ごとに歌詞を正確に合わせる技術も使われている。これもやはりAI技術によるものだろう。
アップルは今年の2月に、イギリスのスタートアップであるAI Musicを買収している。AI Musicはリスナーの心臓の鼓動に音楽を同期させるソフトウェアも開発していた。
楽器パートの分離機能を持つSoundHi、Melissa、Octerv Veoicy
最近(12月19日に)、iOS上でハイレゾ音楽再生ができるアプリ「SoundHi」がVer2.0にアップデートした。AIを使用した演奏パートごとの音量調整は、その新機能のひとつだ。これはセパレーター(音源分離)という機能で、再生中の楽曲をヴォーカル・ドラム・ベース・その他の4つにリアルタイムで分け、それぞれの音量を調整できる。もちろんカラオケとしても使用ができるが、ユーザーが音楽を自分でリミックスするように楽しんだり、楽器の練習にも活用できたりもする。
Windows向けの音楽練習用プレーヤー「Melissa」も、12月20日に公開されたVer3.0において、AIで楽器別の音を分離する機能が追加された。Melissaは楽器練習用の機能を持つプレーヤーソフトだ。この音源分離機能は、AIによって音源からヴォーカル・ピアノ・ベース・ドラムス・その他の楽器の成分を抽出し、分離できる。例えば、ヴォーカルを消して楽器パートのみを残すことができる。
また最近公開された「Octerv Veoicy」というiOS用のアプリは、やはりAIでヴォーカル・ドラム・ベース・その他の演奏パートに音楽を分離することでやはりカラオケなどができるようになっている。
MetaのDemucs
音楽のパートごとの音量調整を行うという点ではカニエ・ウエストが独自に開発した「STEM PLAYER」も存在したが、これは音楽のパートごとのデータを保持したステム・データが必要であった。しかしこれらのソフトウエアではステム・データのない音楽からも自動的にAIで楽器パートを抽出できる。そして抽出するパートの機能や公開日時が類似している点にも気がつかれただろうか。
これは、Octerv Veoicyでは明記されているのだが、これらのソフトウェアでは共通してMeta(旧Facebook)が開発して9月に公開した「Demucs」というAIで音楽からヴォーカル・ドラム・ベース・その他に分離することができるオープンソースプロジェクトの成果を流用しているからだと考えられる。Demucsのようなソフトウェアライブラリーが公開されることで、多数の応用ソフトウェアやアプリケーションがAIの恩恵を得ることができるようになったわけだ。
オープンソースのAIの進化が新しい潮流を生む
最近話題になったAIによる画像生成において国内では有名な「Novel AI Diffusion」も中核では「Stable Diffusion」というソフトウェアを使用している。このようにやはり基本ソフトウエアがあって応用ソフトウエアが広まっていくという点では同じだ。
12月23日には、OpenAIが発表した「ChatGPT」に対して、グーグルが警戒心を抱き、いままでAIに関しては慎重だった同社の戦略を大きく転換させることになったという報道があった。グーグルは人道・倫理的な観点からAIの応用については慎重な会社だったのだが、高レベルの文章でユーザーの問いに答えてくれるChatGPTなどを看過すると、同社の検索ビジネスにも打撃があるとしてこの転換に踏み切ったと考えられる。
こうしたAI技術の戦いは来年はさらに活発に、そしてさまざまな意味で過激になっていくことだろう。
この連載の記事
-
第300回
AV
インド発の密閉型/静電式ヘッドホン? オーディオ勢力図の変化を感じた「INOX」 -
第299回
AV
夏のヘッドフォン祭 mini 2024レポート、突然のfinal新ヘッドホンに会場がわく! -
第298回
AV
ポタフェス2024冬の注目製品をチェック、佐々木喜洋 -
第297回
AV
なんか懐かしい気分、あなたのApple WatchをiPodにする「tinyPod」が登場 -
第296回
AV
逆相の音波で音漏れを防げる? 耳を塞がないヘッドホン「nwm ONE」──NTTソノリティ -
第295回
AV
NUARLのMEMS搭載完全ワイヤレス「Inovatör」(旧X878)の秘密とは? -
第294回
AV
AirPodsで使用者の動きからBPMを認識、それを何かに応用できる特許 -
第293回
AV
次世代AirPodsにはカメラが付くらしい、じゃあ何に使う?(ヒント:Vision Pro) -
第292回
AV
OTOTEN発、LinkPlayの多機能ネット再生機「WiiM」とSHANLINGの「EC Smart」を聴く -
第291回
AV
ビクターの新機軸、シルク配合振動板の魅力とは? HA-FX550Tを聴く -
第290回
AV
HDTracksがMQA技術を使ったストリーミング配信開始へ - この連載の一覧へ