加速度センサーや機械学習を駆使して会話を感知する
次にトン氏は「会話感知」機能について、これは他のメーカーもやっているが、アップルではさらに自然なように思うと述べ、機械学習はどのように働いているのかとが聞く。
トレスキー氏は「会話感知機能では、あなたが何を話しているか(内容)とあなたの動きを監視して、その会話がオーディオの再生音をどう下げるべきかどうかを判断している。さらにAirPodsで再生されているコンテンツが音楽ならば音を小音量にしてBGMのようにするだけだが、ポッドキャストの場合にはミュートではなくポーズをして一時停止する。このように間に会話が入ってもコンテンツをシームレスに楽しむことができる」と語った。
この発言にはいささか驚いた。他人と会話しているとポッドキャストの内容が頭に入ってこないからだと思うが、そこまでやっているとは思わなかった。自分でも試してみたが、確かに再生しているのが音楽だと発声しても音が下がるだけだが、ポッドキャストでは発声すると一時停止する。つまり、会話検知機能はインテリジェントな機能であるというわけだ。
さらにファン氏は「会話感知では加速度センサーも併用して振動の周波数で顎の動きを監視している。なぜかというと咳や咀嚼音を会話と切り分けるためで、これはAirPods内部のH2プロセッサーで機械学習する」と捕捉した。
会話感知に加速度センサーや機械学習まで駆使しているとはアップルの作り込み度合いには頭が下がる。アップルはAIに弱いと言われるが、実はこうした細かい部分まで機械学習を生かしているのは面白い。
そこでトン氏が、ユーザーが歌を歌っているときは会話感知は切ったほうがいいのと聞くと、ファン氏は「歌は会話と似ているからトリガーになるかもしれません、でもApple Musicには新機能があって、歌詞を表示して歌を歌っているときは会話感知が自動的にオフになるんです」と、ちょっと驚くコメントをさらっと口にした。トン氏も「それは初耳だ」と驚きを見せた。アップルはこうしたアナウンスしていない新機能を何気なく入れて使いやすさを改善しているのが興味深い。
ファン氏は「少し前のアップデートで追加された会話ブースト機能もこれらの機能とうまく協調して働いている」と続ける。
ハンズフリーはジェスチャー操作にも
もう一つ興味深いのはここでトレスキー氏が「こうしてイヤホンが生活の一部になることに対して"ハンズフリー"がキーとなる」と補足し、ファン氏が「それに対しては音声認識のSiriがそのハンズフリーのキーとなる」と語っている。
今年「Hey Siri」と言わず「Siri」の一音節で指示の開始を検知できるようになったのもその一環ということだ。巷ではSiriは時代遅れとも言われるが、このことからSiriに対してアップルはそれなりにまだコミットしていくと思われる。
ファン氏は「ゲームなどのインターフェースとして、頭を振る動作をAirPodsがジャイロで感知することも可能だろう」と、ハンズフリー化について捕捉する。さらにトレスキー氏が「センシングという点ではH2の電力消費が小さいということもそれに寄与する」と語っている。つまりH2チップはイヤホンのインテリジェント化に貢献しているだけではなく、電力消費が小さいのでセンサーの稼働も増やせるということなのだろう。
状況に応じて音を上げるのか、ノイズを消すのかを調整する
さらに話題が「パーソナライズされた音量」に移ると、ファン氏は「音楽を楽しむためには二つのノブがある。ひとつは環境音をノイキャンで下げること、もうひとつは聞いている音楽の音量を上げることだ。このため環境音を測定すると同時に、聞いている音楽の環境音に対するS/N比を測定している。どのくらい外の音を取り入れて、コンテンツの音を生かすかの初期値は我々が何万時間のデータを元に機械学習させているが、環境音と聞く音楽の組み合わせは個々人で多様であり、そのためにユーザーがどのくらい音を上げて聞きたいかなどをさらに学習する機能をいれている」と語っている。
私が書いた体験記では「パーソナライズされた音量」はあまり効きが大きくないというように書いたが、実際にこの機能はうるさいところで音を上げる極端に音を上下させるような機能ではなく、さまざまな環境で外部ノイズと音楽信号のS/N比を調整して、音をよく聴かせるための機能ではないかと思う。
そして、その度合いはやはり学習により経時的に変化するのだろう。
この連載の記事
-
第300回
AV
インド発の密閉型/静電式ヘッドホン? オーディオ勢力図の変化を感じた「INOX」 -
第299回
AV
夏のヘッドフォン祭 mini 2024レポート、突然のfinal新ヘッドホンに会場がわく! -
第298回
AV
ポタフェス2024冬の注目製品をチェック、佐々木喜洋 -
第297回
AV
なんか懐かしい気分、あなたのApple WatchをiPodにする「tinyPod」が登場 -
第296回
AV
逆相の音波で音漏れを防げる? 耳を塞がないヘッドホン「nwm ONE」──NTTソノリティ -
第295回
AV
NUARLのMEMS搭載完全ワイヤレス「Inovatör」(旧X878)の秘密とは? -
第294回
AV
AirPodsで使用者の動きからBPMを認識、それを何かに応用できる特許 -
第293回
AV
次世代AirPodsにはカメラが付くらしい、じゃあ何に使う?(ヒント:Vision Pro) -
第292回
AV
OTOTEN発、LinkPlayの多機能ネット再生機「WiiM」とSHANLINGの「EC Smart」を聴く -
第291回
AV
ビクターの新機軸、シルク配合振動板の魅力とは? HA-FX550Tを聴く -
第290回
AV
HDTracksがMQA技術を使ったストリーミング配信開始へ - この連載の一覧へ