このページの本文へ

スマホが「本人そっくりの声」で喋るサービスの意外なニーズ

2018年01月11日 06時00分更新

文● 岡田光雄(ダイヤモンド・オンライン

  • この記事をはてなブックマークに追加
  • 本文印刷

スマートフォンのSiriやOK Googleなどでも使われている「音声認識・合成技術」。昨年7月には、東芝デジタルソリューションズも、この技術を利用した新たなサービス「コエステーション」を発表した。“コエ”のマーケットが急速に拡大している今、国立情報学研究所の准教授・山岸順一氏にその技術の最前線を聞いた。(清談社 岡田光雄)

人間のアイデンティティである
「声」を「コエ」に

SiriやOK Googleなどでは、声の質は重視されていないが、ここ最近は、「自分の声」をAIが再現してくれるようなサービスが日本で開発されている。「自分の声」には、いったいどんなビジネスチャンスがあるのだろうか?

 コエビジネスの根幹をなしているのが、音声認識・合成技術。これは人間の声をコンピューターに認識・識別させ、さらには人間の声を人工的に合成し作り出す技術のことである。

 BCCリサーチ社によると、音声認識・合成技術関連の世界市場規模は、2011年には470億ドル(5兆2749億円)だったが、17年中には1130億ドル(12兆6823億円)に達すると見込まれている。位置情報を読み上げるカーナビや、スマホの音声認識、“しゃべる家電”で有名なIoTデバイスなど、生活の中にも着実に浸透しはじめている。

 ただし、ボーカロイドといった例外はあるものの、これまでの製品を見ると、音声技術が使われている製品の大半は、コエの“質”には、それほど重きが置かれていなかった印象がある。しかしここ最近は消費者ニーズの高まりによって、コエの質が必要とされるケースが急増しているようだ。

 それを象徴するのが医療分野である。

 例えばALS(筋萎縮性側索硬化症)などにかかり、声を失った患者は通常、意思伝達装置(重度障碍者用伝達装置)というものを利用する。この機器は、手の指先、足、目のまばたきなどでスイッチを操作して、文章を作成したり読み上げたりできる装置だが、音声技術の向上によって、そのコエを自分自身の声と同じものにする研究が進んでいるのだ。

AIの進歩が
実用化をスピードアップ

「つい数ヵ月前までしゃべれていたのに、急にそれができなくなった患者さんの心理的負担は相当大きいはずです。親しい人たちに自分の声を覚えていてほしいでしょうし、家族や友人も患者さんの声を聞きたいと思っています。声はその人のアイデンティティですからね」(山岸氏)

 音声認識・合成技術は、基礎研究の成果が出てから実用化されて市場に出るまでのスパンが短い。特にここ10年は、AI(人工知能)の研究も急速に進んできたこともあり、ますます実用化までのスピードが速まっている。

「昔は、音声機器に自分の声をしゃべらせる場合、大規模な音声データが必要だったので、数百時間、何ヵ月にもわたってスタジオで収録するのが主流でしたが、実際に発語などに障害を持っている人が長時間収録をするのは無理があります。しかし近年のAI技術などの進歩により、今では5分以内の収録で済むようになったのです」(山岸氏)

 コエ技術の向上は医療分野だけに限ったものではない。

 昨年7月、東芝デジタルソリューションズが開発を発表し、17年度中に製品化が予定されているというサービス「コエステーション」は、スマートフォンにコエステーションの無料アプリをインストールした一般ユーザーが、自分の声で例文を読み上げて録音すると自分のコエが作られ、それを元にスマホでテキストを入力するだけで音声合成を使って自由にしゃべらせることができるというもの。自分のコエは自分で使うこともできるし、(本人が許可をすれば)親しい人間が使うこともできる。

自分の声は嫌いでも
親しい誰かは欲している

 もっとも、気になるのはこの技術の使い道。音声心理学者の山崎広子氏の調査によれば、日本人の8割は自分の声を嫌っているという。そんな中で東芝デジタルソリューションズは、一体どこにビジネスの勝機があると考えたのか。

 将来的な用途例について、東芝デジタルソリューションズ・RECAIUS事業推進室コエステーション事業プロジェクトリーダーの金子祐紀氏はこう説明する。

「例えば恋人からSNSのメッセージが届いたとして、それを恋人自身のコエで文章を読み上げたり、逆に相手のスマホで自分のコエを使ってもらうこともできます。大好きな孫のコエでスケジュールやニュース記事を読み上げるのもいいでしょう。もし何かしらのオンラインゲームとコラボできれば、自分のアバターにコエを乗せて相手とコミュニケーションを取れるようにもなります。もちろんオレオレ詐欺対策やセキュリティーの観点から、自分のコエを第三者が無断で使うことはできないようにもなっています」

 なるほど、どれだけ嫌いな自分の声でも、そのコエを欲してくれる人に向けてのサービスということなのだろう。

 山岸氏によれば、こういったビジネスはこれまで、大企業の参入が少なかった分野でもあるという。

「世界的な巨大企業であるGoogleやAppleも、音声認識・合成技術の研究や製品化に熱心ではありましたが、コエステーションのように個人から声を集めて個人が使うというビジネスはやっていませんでした。おそらく大企業が参入するには、市場規模が不透明なことも理由にあったと思います。しかし間違いなくニーズは高まっているので、日本企業にしてみれば世界に向けたビジネスチャンスといえるかもしれませんね」

 人間のアイデンティティである「コエ」に特化したビジネス。その戦国時代が今、始まろうとしているのかもしれない。


※本記事はダイヤモンド・オンラインからの転載です。転載元はこちら

カテゴリートップへ

最新記事
最新記事

ASCII.jp ビジネスヘッドライン

アスキー・ビジネスセレクション

QDレーザー販促企画バナー

ピックアップ