「歌ってもらえますか?」 「もちろんです!」――。
5日から開催されている「CEATEC JAPAN 2010」。こじんまりしたスペースながら、人だかりを作っていたブースがある。名古屋工業大学・国際音声技術研究所だ。研究所が今回発表したのは「MMDAgent」、ズバリ画面の3Dキャラクターと対話できるシステムだ。
「こんにちは」とマイクに向かって話しかけると、キャラクターがお辞儀をしながら「こんにちは」と返してくれる。冒頭のやりとりを終えると、CGアイドル・初音ミクが踊りはじめた。
![]() | ![]() | |
|---|---|---|
| MMDAgent。これは初音ミクの3Dモデルを使った場合。マイクに向かって話しかけると、あらかじめ設定しておいた動きと返事を返してくれる | こちらは「めいちゃん」という3Dモデル。名古屋工業大学の学内を案内してくれるように設定されている |
CEATEC会場で「MMDAgent」を試してみた!
とはいえ対話システムそのものは、長年研究がつづけられてきた分野。「MMDAgent」のどこが新しいのだろう。そして何より、なぜわざわざ「初音ミク」なのか? 徳田恵一教授にお話を伺ったところ、日本のネットユーザーへの期待感が見えてきた。
MMDAgent ここがスゴい5つのポイント
MMDAgentが目指したものは「臨場感のある音声対話システムを誰でも作れること」だ。初めに、そのスゴさを5つに分けて紹介したい。
1. 人間っぽい対話ができる
まずは人と話している感覚にものすごく近いことだ。
返事の反応がとにかく早い。これまでのシステムは、質問をすべて聞いてからワンテンポ置いて返事をする、というタイプのものが多かったが、MMDAgentはユーザーの質問が終わると同時に答えられるようになっている。
また、MMDAgentが答えている最中に話しかけられるのもポイント。「今日の天気を教えて!」という質問に答えている最中に「あ、やっぱり明日の天気を教えて」と言いなおしても、すぐさま「わかりました」と答えてくれる。
![]() | 大型ディスプレーを使って等身大で表示していたので、かなりリアルに近い印象 |
|---|
話し方も一定ではなく、怒りや悲しみといった「感情」が変化させられる。3Dモデルのモーションもなめらかで表情も人間に近い。大型ディスプレーに等身大で表示されているため、機械っぽさがかなり減っている。
2.対話をすぐに作れる
次は、「対話スクリプト」という単純なコードを入れるだけで、会話が作れること。
必要なのは「どういう言葉を認識したら」「どう動いて」「どう返事をするか」の3点だけ。もちろん、より複雑な動作や応答を定義したり、一連のやりとりをつなぎ、会話がどんどん進んでいくようなストーリーを構築することもできる。
取材現場でたまたま一緒にいたニコニコ動画の有名人・伊予柑さんは、スタッフにお願いして「そんな装備で大丈夫か?」という質問に対し、初音ミクが「大丈夫だ、問題ない」とガッツポーズで返すパターンを仕込んでもらっていた(関連記事)。
![]() |
|---|
| 対話スクリプトの画面。画面中央あたりに「装備」「大丈夫」をキーに、初音ミクが「大丈夫だ、問題ない」と答えるプログラムが書かれている |
(次ページに続く)
この特集の記事
- Silverlightで5.1chサラウンド! SRSの新技術
- 最新スマートフォンから未来技術までCEATECで見たケータイ
- ケータイ向けの新放送!? マルチメディア放送とは?
- 3D一色!? CEATECで体験する最新テレビ
- この特集の一覧へ

















