加速度センサーや機械学習を駆使して会話を感知する
次にトン氏は「会話感知」機能について、これは他のメーカーもやっているが、アップルではさらに自然なように思うと述べ、機械学習はどのように働いているのかとが聞く。
トレスキー氏は「会話感知機能では、あなたが何を話しているか(内容)とあなたの動きを監視して、その会話がオーディオの再生音をどう下げるべきかどうかを判断している。さらにAirPodsで再生されているコンテンツが音楽ならば音を小音量にしてBGMのようにするだけだが、ポッドキャストの場合にはミュートではなくポーズをして一時停止する。このように間に会話が入ってもコンテンツをシームレスに楽しむことができる」と語った。
この発言にはいささか驚いた。他人と会話しているとポッドキャストの内容が頭に入ってこないからだと思うが、そこまでやっているとは思わなかった。自分でも試してみたが、確かに再生しているのが音楽だと発声しても音が下がるだけだが、ポッドキャストでは発声すると一時停止する。つまり、会話検知機能はインテリジェントな機能であるというわけだ。
さらにファン氏は「会話感知では加速度センサーも併用して振動の周波数で顎の動きを監視している。なぜかというと咳や咀嚼音を会話と切り分けるためで、これはAirPods内部のH2プロセッサーで機械学習する」と捕捉した。
会話感知に加速度センサーや機械学習まで駆使しているとはアップルの作り込み度合いには頭が下がる。アップルはAIに弱いと言われるが、実はこうした細かい部分まで機械学習を生かしているのは面白い。
そこでトン氏が、ユーザーが歌を歌っているときは会話感知は切ったほうがいいのと聞くと、ファン氏は「歌は会話と似ているからトリガーになるかもしれません、でもApple Musicには新機能があって、歌詞を表示して歌を歌っているときは会話感知が自動的にオフになるんです」と、ちょっと驚くコメントをさらっと口にした。トン氏も「それは初耳だ」と驚きを見せた。アップルはこうしたアナウンスしていない新機能を何気なく入れて使いやすさを改善しているのが興味深い。
ファン氏は「少し前のアップデートで追加された会話ブースト機能もこれらの機能とうまく協調して働いている」と続ける。
ハンズフリーはジェスチャー操作にも
もう一つ興味深いのはここでトレスキー氏が「こうしてイヤホンが生活の一部になることに対して"ハンズフリー"がキーとなる」と補足し、ファン氏が「それに対しては音声認識のSiriがそのハンズフリーのキーとなる」と語っている。
今年「Hey Siri」と言わず「Siri」の一音節で指示の開始を検知できるようになったのもその一環ということだ。巷ではSiriは時代遅れとも言われるが、このことからSiriに対してアップルはそれなりにまだコミットしていくと思われる。
ファン氏は「ゲームなどのインターフェースとして、頭を振る動作をAirPodsがジャイロで感知することも可能だろう」と、ハンズフリー化について捕捉する。さらにトレスキー氏が「センシングという点ではH2の電力消費が小さいということもそれに寄与する」と語っている。つまりH2チップはイヤホンのインテリジェント化に貢献しているだけではなく、電力消費が小さいのでセンサーの稼働も増やせるということなのだろう。
状況に応じて音を上げるのか、ノイズを消すのかを調整する
さらに話題が「パーソナライズされた音量」に移ると、ファン氏は「音楽を楽しむためには二つのノブがある。ひとつは環境音をノイキャンで下げること、もうひとつは聞いている音楽の音量を上げることだ。このため環境音を測定すると同時に、聞いている音楽の環境音に対するS/N比を測定している。どのくらい外の音を取り入れて、コンテンツの音を生かすかの初期値は我々が何万時間のデータを元に機械学習させているが、環境音と聞く音楽の組み合わせは個々人で多様であり、そのためにユーザーがどのくらい音を上げて聞きたいかなどをさらに学習する機能をいれている」と語っている。
私が書いた体験記では「パーソナライズされた音量」はあまり効きが大きくないというように書いたが、実際にこの機能はうるさいところで音を上げる極端に音を上下させるような機能ではなく、さまざまな環境で外部ノイズと音楽信号のS/N比を調整して、音をよく聴かせるための機能ではないかと思う。
そして、その度合いはやはり学習により経時的に変化するのだろう。
この連載の記事
-
第279回
AV
Chordの積み木型オーディオシステムが面白い、「Suzi」と「Suzi Pre」 -
第278回
AV
さすがにSpotifyもロスレス対応しそう、Redditユーザーがさらに解析結果をリーク -
第277回
AV
スマホがLE Audioに対応していなくても、なぜAuracastを使えるのか? -
第276回
AV
Amazon Musicも生成AIを使ったプレイリスト作成機能提供、あいまいな指示に応える -
第275回
AV
ソリッドなステンレス筐体とK2HDサウンド、iFi audioの「Go bar 剣聖」 -
第274回
AV
いよいよSpotifyもロスレス配信か、Redditに解析情報 -
第273回
AV
ソニーが米国で展開し始めた、重低音新シリーズ「ULT POWER SOUND」とは? -
第272回
AV
自然な文章でプレイスリスト作成をうながせる、Spotifyの新機能 -
第271回
AV
音楽生成AIの進化速度に舌をまく、無料でも試せるStable Audio 2.0を使う -
第270回
AV
耳をふさがないイヤホンで高音質を追究したい人に、Cleer Audioがいいぞ!! -
第269回
AV
期待が高まる「Fokus Triumph」の音、NobleのMEMSスピーカー搭載イヤホン第3弾 - この連載の一覧へ