このページの本文へ

CEATEC JAPAN 2010レポート 第5回

ネットの力、お借りしたい――初音ミクと話せる「MMDAgent」

2010年10月08日 12時00分更新

文● 広田稔

  • この記事をはてなブックマークに追加
  • 本文印刷

3.MMDのモデリングデータを使える

 つづいては、どんなキャラクターでも画像に使えること。

 MMDAgentの「MMD」は、フリーの3Dグラフィックソフト「MikuMikuDance」の略称だ。ニコニコ動画では、MMDを使ったユーザーの手で、様々なキャラクターの同人的な3Dデータが作られている(関連記事)。

 MMDAgentでこれらのモデリングデータを読みこめば、そのキャラクターと対話ができるようになる。実際、会場のデモで使っていた初音ミクはMMDユーザーのLat氏が作成した「Lat式ミク」というモデルを使ったものだ。

 また、人の声を認識する「認識用音響モデル」や、キャラクターボイス「合成用音響モデル」も差し替えが利く。初音ミクのデモで使われた合成用音響モデルは、VOCALOID2のエンジンを使わず、国際音声技術研究所が作ったものを採用している(詳細は後述)。

MMDAgentには、音声認識/対話/3Dレンダリング/音声合成という4つのモジュールから構成される。ユーザーはそのモジュールをどうつかうか、辞書やモーションデータ、対話スクリプトで指定していく

CEATEC会場に展示されていたMMDAgentの解説

 このMMDAgent、下表のように国際音声技術研究所がこれまでに研究し、オープンソースとして公開してきた技術をフル活用している。いわば音声技術の「合体ロボット」だ。長年の積み重ねを経て、その集大成としてMMDAgentが生まれてきたのだ。

ソフト名 概要
Julius 音声認識エンジン。数万語の音声認識を一般的なパソコンでほぼリアルタイム実行できる
HTS パターン認識の基本モデル「隠れマルコフモデル」(HMM)に基づく、新しい音声合成システム。声をマネたり、声に感情をつけられる
Open JTalk 日本語の文章から音声を合成するテキスト音声合成システム。HTSで学習した合成用音響モデルを入れ替えたり、補間することで、色々な声質で文章をしゃべらせられる

4.市販のデスクトップパソコンで動きます

 一般的なWindowsパソコンで動くというのも大きなメリットだ。

 スペックは、いわゆる市販のデスクトップパソコンで十分。ただし、フルHDなど、大画面で動作させるにはそれなりのグラフィック性能が必要だ。会場では指向性の強い特別なものを用意していたマイクも、静かな室内なら一般的なマイクでオーケーという。


5.年内にオープンソースとして公開

 そして一番驚きなのが、年内にオープンソースで無償公開を予定しているということだ。Twitterで返事をしてくれるbotプログラムのように、話しかけると返事をしてくれる3Dキャラが、自分のパソコンに来るかもしれない。ライセンスを明記すれば商用でも利用できるという。

 もちろん好きなキャラクターを動かそうとすると、3Dモデル、音響モデル、モーション、自然言語処理系の辞書と、様々なものが必要になる。だがその辺は、ネットで「ネ申」と呼ばれるユーザーたちがどうにかしてくれる……かもしれない。



(次ページに続く)

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン