このページの本文へ

非常時には緊急っぽい声のトーンで音声合成

富士通研究所、多彩な声のトーンで情報を伝える音声合成技術を開発

2014年03月31日 14時54分更新

文● 行正和義

  • この記事をはてなブックマークに追加
  • 本文印刷

音声合成の利用シーン

 富士通研究所は、高品質で多彩な声を短期間で作成でき、利用シーンや利用環境に合わせたトーンで情報を伝える音声合成技術を開発した。

開発した音声合成の概要

 音声合成技術の進歩により、自然にテキストを読み上げる事が可能になったが、さまざまなシーンに応じて声のトーンを変えることで状況を聞き手に伝えやすくなる。新たに開発された音声合成技術は、緊急時は警告感のあるトーン、雑音が激しいところでは通りやすい音声で情報を伝えるなど、状況に応じた音声を合成してユーザーに提供する。

 音声合成はオリジナルの音声を分析・加工して自由なテキスト読み上げに用いるもので、柔軟な音声合成を実現のため声質やイントネーション、間の取り方といった特徴を捉えたパラメーターに変換して合成。各パラメーターを調整することで緊急度に応じた警告音声や、通りやすい音声にすることができる。パラメーター変換技術と機械学習を用いたアルゴリズムから、オリジナルの録音音声が少量でも多彩な音声を従来の約30分の1の時間で製作することが可能という。

開発した音声合成の利用例

 工場で運用するシステムや市町村の防災行政無線など、普通のトーン、緊急時には警告感のあるトーン、災害時時には強い警告感のあるトーンなど、深刻さの度合いに応じたメッセージができるほか、親しみやすいキャラクターのような特徴を持たせることもできるので、さまざまな応用が可能という。

■Amazon.co.jpで購入

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン