3.MMDのモデリングデータを使える
つづいては、どんなキャラクターでも画像に使えること。
MMDAgentの「MMD」は、フリーの3Dグラフィックソフト「MikuMikuDance」の略称だ。ニコニコ動画では、MMDを使ったユーザーの手で、様々なキャラクターの同人的な3Dデータが作られている(関連記事)。
MMDAgentでこれらのモデリングデータを読みこめば、そのキャラクターと対話ができるようになる。実際、会場のデモで使っていた初音ミクはMMDユーザーのLat氏が作成した「Lat式ミク」というモデルを使ったものだ。
また、人の声を認識する「認識用音響モデル」や、キャラクターボイス「合成用音響モデル」も差し替えが利く。初音ミクのデモで使われた合成用音響モデルは、VOCALOID2のエンジンを使わず、国際音声技術研究所が作ったものを採用している(詳細は後述)。
このMMDAgent、下表のように国際音声技術研究所がこれまでに研究し、オープンソースとして公開してきた技術をフル活用している。いわば音声技術の「合体ロボット」だ。長年の積み重ねを経て、その集大成としてMMDAgentが生まれてきたのだ。
ソフト名 | 概要 |
---|---|
Julius | 音声認識エンジン。数万語の音声認識を一般的なパソコンでほぼリアルタイム実行できる |
HTS | パターン認識の基本モデル「隠れマルコフモデル」(HMM)に基づく、新しい音声合成システム。声をマネたり、声に感情をつけられる |
Open JTalk | 日本語の文章から音声を合成するテキスト音声合成システム。HTSで学習した合成用音響モデルを入れ替えたり、補間することで、色々な声質で文章をしゃべらせられる |
4.市販のデスクトップパソコンで動きます
一般的なWindowsパソコンで動くというのも大きなメリットだ。
スペックは、いわゆる市販のデスクトップパソコンで十分。ただし、フルHDなど、大画面で動作させるにはそれなりのグラフィック性能が必要だ。会場では指向性の強い特別なものを用意していたマイクも、静かな室内なら一般的なマイクでオーケーという。
5.年内にオープンソースとして公開
そして一番驚きなのが、年内にオープンソースで無償公開を予定しているということだ。Twitterで返事をしてくれるbotプログラムのように、話しかけると返事をしてくれる3Dキャラが、自分のパソコンに来るかもしれない。ライセンスを明記すれば商用でも利用できるという。
もちろん好きなキャラクターを動かそうとすると、3Dモデル、音響モデル、モーション、自然言語処理系の辞書と、様々なものが必要になる。だがその辺は、ネットで「ネ申」と呼ばれるユーザーたちがどうにかしてくれる……かもしれない。
(次ページに続く)
この連載の記事
-
第4回
AV
Silverlightで5.1chサラウンド! SRSの新技術 -
第3回
スマホ
最新スマートフォンから未来技術までCEATECで見たケータイ -
第2回
スマホ
ケータイ向けの新放送!? マルチメディア放送とは? -
第1回
AV
3D一色!? CEATECで体験する最新テレビ -
AV
CEATEC JAPAN 2010レポート - この連載の一覧へ