このページの本文へ

四本淑三の「ミュージック・ギークス!」 第34回

初音ミクと「ゆっくり」の声、何が違う? アクエスト社に聞く

2010年08月29日 12時00分更新

文● 四本淑三

  • この記事をはてなブックマークに追加
  • 本文印刷

合成音声一筋二十有余年

―― まず山崎さんについて教えてください。

山崎 私は大学を卒業してから、ずーっと音声合成しかやってないんです。大学は音声認識の研究で卒業しました。そして就職して最初に与えられたテーマが音声合成だったんです。だからここ二十数年間は、音声合成しかやっていない。音声合成バカですね。

「音声合成バカ」を自負する山崎信英さん

―― 音声合成って何が面白いんですか?

山崎 純粋な自然科学ではないことです。音声は生身の人間が研究対象になってくるので、割り切れない部分が多い。それと有難かったのは、研究者のテーマは、時代が進んでいくうちに変えることを余儀なくされるケースが多いんですけど、音声にはそれがなかった。コンピュータが世の中に出た当初から、研究はされているんですけどね。

―― 具体的にはどういう研究をしているんですか?

山崎 私がやっているのはテキスト音声合成「Text To Speech(TTS)」と呼ばれている分野ですね。

―― いわゆる読み上げですよね。

山崎 学会レベルでTTSは基本のメインテーマなんですけど、初音ミクが知られる以前は「ああ、喋ったことを文字にしてくれるあれね」みたいに、音声認識と間違えられてましたね。

アクエスト社は音声合成の組み込みウェア開発が中心業務

―― その初音ミクですが、VOCALOIDについてはどう思いましたか?

山崎 昔からヤマハさんが綺麗に歌わせる技術を持っているのは知っていましたが、これだけヒットするとは思いもよらなかったですね。

―― 最初は専用のボードを作ってましたよね

山崎 90年代でしたっけね。私のやっているTTSとは直接競合はしないのですが、最近VOCALOID Flexのようなものが出てきて、少しずつお互いの領域を侵食しあってる感じですよね。昔は喋る方はやらないって聞いていたのに……。

―― 歌も喋りも同じ音声なんでしょうがないですよね。

山崎 でも負けませんから!

専用のボード : ヤマハ PLG100-SG(1997年発売)。フォルマントシンギング音源を搭載し、入力した歌詞で歌わせることができた。MIDI音源やシンセサイザーのプラグインボードとして販売。

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン