このページの本文へ

「知的」や「かわいい」を数値化して好みの(用途に応じた)声を簡単にデザイン

性別、年齢などを操作して声を自在に合成する「声デザイン技術」、東芝

2016年03月09日 16時31分更新

文● 行正和義 編集/ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

声デザイン技術

 東芝は3月8日、用途にあわせて多様な声を簡単かつ自在に音声合成で作成できる「声デザイン技術」を開発したと発表した。

 独自のモデル最適化方式により、性別・年齢・明るさなどの知覚的な声の特徴を示す複数の要素(知覚語)に分解してモデル化した「知覚語空間モデル」を開発。この空間モデルを操作できるGUIを試作し、各要素の強度を変化させて声を自由に作成できる。

声の「知覚語空間モデル」

 さらに、求める特徴の声を簡単に作り出せるように、かわいい・知的・丁寧といった声の印象を表す印象語から「知覚語空間」の座標を定める「印象語変換モデル」も開発してGUIに組み込んだ。かわいい・知的などの印象語やキャラクターの顔画像からベースの声を選定し、さらに性別や年齢などで絞り込み、利用者のイメージに合った声を効率的にデザインできる。

 同社では、クラウドサービス「RECAIUS(リカイアス)」に2016年度中に搭載することを目指して研究開発を進めるとしている。

■関連サイト

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン