日本電信電話(株)は6日、ビブラートの入れ方やこぶし回しなどの“歌唱スタイル”をサポートした歌声合成技術を開発し、アプリケーションに実装するためのライブラリーを含むライセンスを『歌声合成技術“ワンダーホルン”』として提供すると発表した。NTTアドバンステクノロジ(株)を通して外部に技術提供を行なう。
歌声合成技術“ワンダーホルン”の原理 |
歌声合成技術は、あらかじめ個人の実声を収録して作成した個人歌声データベースと、その場で入力された楽譜と歌詞から、人間の歌声をコンピューターで合成するもの。歌声特有の倍音構造を忠実に再現するモデルを採用し、個人の歌声から実際に抽出した特殊ノイズをミックスするのが特徴。ビブラートやこぶしなどの“歌唱スタイル”の調整機能を組み込んだほか、アルゴリズムの改良や軽量化、個人歌声データベースの構造の変更などにより、家庭用ゲーム機やDSP搭載カラオケ機などでも動作するようにしたという。楽譜や歌詞の入力インターフェースにMIDI規格を採用したことで、既存のカラオケ用MIDIデータからバックコーラスの歌声を生成することもできる。
自分だけの歌声メッセージの作り方 |
NTTでは、“ワンダーホルン”をNTT-ATを通じて、アプリケーションごとの個別カスタマイズや装置への組み込み、各種SIなどの技術提供、個人歌声データベース制作などの関連サービスの提供を同日付けで開始する。技術提供に先行して、試用サイト“うたばら.com”を開設しており、用意されたサンプル歌声データベースを利用して実際に歌声合成機能を試すことができる。
NTT-ATでは、ゲーム業界(効果音やキャラクター歌声用途など)、カラオケ業界(バックコーラスやデュエット曲用途など)、おもちゃ業界(歌って踊るロボット用途など)、教育業界(作曲ツールや合唱シミュレーション用途など)への技術提供を計画しており、すでに(株)セガが自社グループのゲームソフトなどの各種エンターテイメント事業向けに採用を検討しているという。NTT-ATとセガは、ワンダーホルンの包括ライセンス契約の交渉を開始したとしている。