このページの本文へ

前へ 1 2 3 4 5 次へ

四本淑三の「ミュージック・ギークス!」第34回

初音ミクと「ゆっくり」の声、何が違う? アクエスト社に聞く

2010年08月29日 12時00分更新

文● 四本淑三

  • この記事をはてなブックマークに追加
  • 本文印刷

究極のテーマは「自然じゃない合成音」

―― そのAquesTalkの音声ライブラリを使った、歌うVSTiがAquesToneですよね。

山崎 ちょっと時代遅れになっちゃってるから、自分も納得していないんですね。根本的に作り直さないとあかんなと。音声合成の技術者としては、あの何言ってるんだか分からない発音は恥ずかしい。

Windows用VSTiのAquesTalk

―― じゃあ新しいバージョン作りましょうよ。

山崎 もし新しいAquesToneを出すのであれば、生身のボーカルを目指すんじゃなくて、機械の声を狙っていきたいんですよね。

―― それは大賛成だなあ。

山崎 昔から音声合成をやっていて、非常に思うところがあって。究極のテーマというのが「自然じゃない合成音」を作りたいんです。世の中の合成音声関係者は「より自然になりました」って言ってしまうんだけど、じゃあ自然って何? 自然な合成音って何のこと? そう考えたときに、いかに人間に近づけるかということを目標にしている。

―― 今の合成音声はそっちの方向を向いていますよね。

山崎 そこから少し下がって、私個人としては、人間の真似をすることは止めにしましょうと。聞きやすかったり、綺麗だったりすれば、人間に似てなくたって全然いいじゃん、というのが根本的な発想なんですよ。

―― 意味が通じて、心地よく聞こえればいいと。

山崎 たとえば活字というのは、人間の手書き文字に比べると、機械的ですけど読みやすい。活字を見たときに、我々は何の違和感もなく受け取ることができますよね。こういったものが音声で作れないかなって。

―― あーっ、なるほど!

山崎 みなさん筆記体を目指していると思うんです。上手い人の文字や、誰かが書いたものを真似して再現しようという。私は人間が喋った音声じゃないんだけれども、活字のような、見た目にすんなり受け入れられるようなものを、最終的には作りたいんです。楽曲を作る人達が、ボーカルは入れたいんだけど、生の声じゃないんだよね、という。そういったイメージで。

―― それは面白いアプローチだと思いますね、音楽的にも。今のVOCALOIDの使われ方は人間の代用という側面が大きくて、だったら人間でいいじゃないという話になってしまう。合成音ならではの表現というのはあまり考えられていないですね。

山崎 だから去年、一昨年なんかは活字の研究をしたんです。今でも分からないのが、明朝体のはね。あれってどう考えたって自然ではないわけで。もちろん毛筆体ではあるけど、それとは違った独特の形じゃないですか。

―― 文字の識別がしやすいんですよね、ハネがあると。

山崎 あのデザインを考えた人はすごいなと。AquesTalk2にはフォントが使えるようにしました。うちは音だからFontじゃなくて「Phont」なんですけど、それを編集したり入れ替えることでいろんな声が出せますよという。

AquesTalkの音源であるPhontを作成するPhontDesigner。パラメーターがシンセっぽくてカッコいい

―― ユーザー側で音がシンセサイズできるんですね。

山崎 でも、活字で言えば、まだ漢字を24×24ドットで表現しているようなものですよね。それがいつになったらTrueTypeみたいなレベルに持っていけるのかは分かりません。ライフワークですね。

―― でも山崎さんも僕も、もう47歳じゃないですか。急がないと。

山崎 いつ死んでもおかしくないですからね。それ以前に、もっと人間の声とはなんぞや、という基礎研究をしてくれる人が出てくれないと。たとえば「か」っていう音は、なぜ「か」として聞こえるのか。そこはほとんど研究されていないんですよ。

―― じゃ、そこもやりましょうよ。

山崎 やりますか、一緒に?



著者紹介――四本淑三

 1963年生まれ。高校時代にロッキング・オンで音楽ライターとしてデビューするも、音楽業界に疑問を感じてすぐ引退。現在はインターネット時代ならではの音楽シーンのあり方に興味を持ち、ガジェット音楽やボーカロイドシーンをフォローするフリーライター。


■関連サイト

前へ 1 2 3 4 5 次へ

カテゴリートップへ

この特集の記事

ASCII.jpメール デジタルMac/iPodマガジン

ASCII.jp RSS2.0 配信中

ピックアップ

富士通パソコンFMVの直販サイト富士通 WEB MART