先日のストリーミング放送「ガジェ音」を見た人は誰でも知っている、でもそれ以外の人はまったく分からない、あのコルグの金森さんによる驚愕のデモ。なんと「KORG DS-10」が「イーデスカ? イーデスヨォ」と喋ってしまうのだ。知らない人はまず聴いて驚け。
そして一体これをどうやって作ったのか、金森さんを訪ねてコルグ本社まで行ってきたのだった。
「フォルマント」のピーク周波数は2つで十分ですよ
シンセに喋らせる方法は、実は広く知られている。人の声には「フォルマント」と呼ばれる独特のスペクトラム分布があって、これをフィルターで再現してやればいいのだ。フォルマントのグラフをざっくり眺めてみると、概ね3つのピーク周波数があって、発音によってピーク周波数の位置、音量に違いがあるのが分かる。
これを人は言葉として聞き分けているわけで、このピーク周波数をフィルターで設定すればいい。アナログシンセならVCF(フィルター)をいくつか使えば不可能ではない。
問題はDS-10の1パートのシンセにはVCFが1つしかないこと。つまりピーク周波数が1つしか作れない。2つあるシンセパートを使っても、2つのピークしか作れない。
金森 フォルマントで重要なのは、ピーク周波数の位置と間隔なんですね。2つのピーク周波数とその間隔を作ってやれば、人間はそれを発音の違いとして聞き取ってしまうんですよ。
―― なるほど。まずピーク周波数は2つで十分。なのでDS-10の2つのシンセパートを使えば、それで人の声も出せると。
金森 ところがですね、あのデモでは1つのシンセパートしか使っていないんです。
そこで登場「リングモジュレーション」
―― えっ。それではフォルマントにならないじゃないですか。ピーク周波数が1つしか作れないんじゃ。先生、私は意味が分かりません。
金森 そこで、リングモジュレーション(ふたつの波形を掛け合わせること)を使います。
―― あーっ、またそんな手の込んだことをしているんですね。具体的にDS-10ではどうやりますか?
金森 DS-10のパッチ画面で、VCO2をVCA INにつなぎます。
―― VCO2の波形周期で音を細かく刻んでやると。これは言い換えるとAM変調(変調方式のひとつ。AMラジオや航空無線に使われる方式)ですね。
金森 そうですね。これで元の波形にはない倍音列が生成されるわけです。たとえば1000Hzの音に1200Hzの変調をかけると、2200Hzと200Hzの周波数が生まれるといった具合で。
―― このリングモジュレーションで新しく出来た倍音列を使えば、VCFが1つでも複数のピーク周波数が作れると。
金森 そういうことです。あとは音を出しながら、それらしく聴こえるポイントを探していきます。このフォルマントを再現した音色に関しては、KORG DS-10のデモソング「DEMO-2」のPATTERN 13でもほぼ同じことをやっています。