ネットの力、お借りしたい――初音ミクと話せる「MMDAgent」

2010年10月08日 12時00分更新

文● 広田稔

　つづいては、どんなキャラクターでも画像に使えること。

　MMDAgentの「MMD」は、フリーの3Dグラフィックソフト「MikuMikuDance」の略称だ。ニコニコ動画では、MMDを使ったユーザーの手で、様々なキャラクターの同人的な3Dデータが作られている（関連記事）。

　MMDAgentでこれらのモデリングデータを読みこめば、そのキャラクターと対話ができるようになる。実際、会場のデモで使っていた初音ミクはMMDユーザーのLat氏が作成した「Lat式ミク」というモデルを使ったものだ。

　また、人の声を認識する「認識用音響モデル」や、キャラクターボイス「合成用音響モデル」も差し替えが利く。初音ミクのデモで使われた合成用音響モデルは、VOCALOID2のエンジンを使わず、国際音声技術研究所が作ったものを採用している（詳細は後述）。

MMDAgentには、音声認識／対話／3Dレンダリング／音声合成という4つのモジュールから構成される。ユーザーはそのモジュールをどうつかうか、辞書やモーションデータ、対話スクリプトで指定していく

CEATEC会場に展示されていたMMDAgentの解説

　このMMDAgent、下表のように国際音声技術研究所がこれまでに研究し、オープンソースとして公開してきた技術をフル活用している。いわば音声技術の「合体ロボット」だ。長年の積み重ねを経て、その集大成としてMMDAgentが生まれてきたのだ。

ソフト名	概要
Julius	音声認識エンジン。数万語の音声認識を一般的なパソコンでほぼリアルタイム実行できる
HTS	パターン認識の基本モデル「隠れマルコフモデル」（HMM）に基づく、新しい音声合成システム。声をマネたり、声に感情をつけられる
Open JTalk	日本語の文章から音声を合成するテキスト音声合成システム。HTSで学習した合成用音響モデルを入れ替えたり、補間することで、色々な声質で文章をしゃべらせられる

　一般的なWindowsパソコンで動くというのも大きなメリットだ。

　スペックは、いわゆる市販のデスクトップパソコンで十分。ただし、フルHDなど、大画面で動作させるにはそれなりのグラフィック性能が必要だ。会場では指向性の強い特別なものを用意していたマイクも、静かな室内なら一般的なマイクでオーケーという。

　そして一番驚きなのが、年内にオープンソースで無償公開を予定しているということだ。Twitterで返事をしてくれるbotプログラムのように、話しかけると返事をしてくれる3Dキャラが、自分のパソコンに来るかもしれない。ライセンスを明記すれば商用でも利用できるという。

　もちろん好きなキャラクターを動かそうとすると、3Dモデル、音響モデル、モーション、自然言語処理系の辞書と、様々なものが必要になる。だがその辺は、ネットで「ネ申」と呼ばれるユーザーたちがどうにかしてくれる……かもしれない。

(次ページに続く)

前へ 1 2 3 次へ