「知的」や「かわいい」を数値化して好みの(用途に応じた)声を簡単にデザイン
性別、年齢などを操作して声を自在に合成する「声デザイン技術」、東芝
2016年03月09日 16時31分更新
東芝は3月8日、用途にあわせて多様な声を簡単かつ自在に音声合成で作成できる「声デザイン技術」を開発したと発表した。
独自のモデル最適化方式により、性別・年齢・明るさなどの知覚的な声の特徴を示す複数の要素(知覚語)に分解してモデル化した「知覚語空間モデル」を開発。この空間モデルを操作できるGUIを試作し、各要素の強度を変化させて声を自由に作成できる。
さらに、求める特徴の声を簡単に作り出せるように、かわいい・知的・丁寧といった声の印象を表す印象語から「知覚語空間」の座標を定める「印象語変換モデル」も開発してGUIに組み込んだ。かわいい・知的などの印象語やキャラクターの顔画像からベースの声を選定し、さらに性別や年齢などで絞り込み、利用者のイメージに合った声を効率的にデザインできる。
同社では、クラウドサービス「RECAIUS(リカイアス)」に2016年度中に搭載することを目指して研究開発を進めるとしている。