「歌ってもらえますか?」 「もちろんです!」――。
5日から開催されている「CEATEC JAPAN 2010」。こじんまりしたスペースながら、人だかりを作っていたブースがある。名古屋工業大学・国際音声技術研究所だ。研究所が今回発表したのは「MMDAgent」、ズバリ画面の3Dキャラクターと対話できるシステムだ。
「こんにちは」とマイクに向かって話しかけると、キャラクターがお辞儀をしながら「こんにちは」と返してくれる。冒頭のやりとりを終えると、CGアイドル・初音ミクが踊りはじめた。
CEATEC会場で「MMDAgent」を試してみた!
とはいえ対話システムそのものは、長年研究がつづけられてきた分野。「MMDAgent」のどこが新しいのだろう。そして何より、なぜわざわざ「初音ミク」なのか? 徳田恵一教授にお話を伺ったところ、日本のネットユーザーへの期待感が見えてきた。
MMDAgent ここがスゴい5つのポイント
MMDAgentが目指したものは「臨場感のある音声対話システムを誰でも作れること」だ。初めに、そのスゴさを5つに分けて紹介したい。
1. 人間っぽい対話ができる
まずは人と話している感覚にものすごく近いことだ。
返事の反応がとにかく早い。これまでのシステムは、質問をすべて聞いてからワンテンポ置いて返事をする、というタイプのものが多かったが、MMDAgentはユーザーの質問が終わると同時に答えられるようになっている。
また、MMDAgentが答えている最中に話しかけられるのもポイント。「今日の天気を教えて!」という質問に答えている最中に「あ、やっぱり明日の天気を教えて」と言いなおしても、すぐさま「わかりました」と答えてくれる。
話し方も一定ではなく、怒りや悲しみといった「感情」が変化させられる。3Dモデルのモーションもなめらかで表情も人間に近い。大型ディスプレーに等身大で表示されているため、機械っぽさがかなり減っている。
2.対話をすぐに作れる
次は、「対話スクリプト」という単純なコードを入れるだけで、会話が作れること。
必要なのは「どういう言葉を認識したら」「どう動いて」「どう返事をするか」の3点だけ。もちろん、より複雑な動作や応答を定義したり、一連のやりとりをつなぎ、会話がどんどん進んでいくようなストーリーを構築することもできる。
取材現場でたまたま一緒にいたニコニコ動画の有名人・伊予柑さんは、スタッフにお願いして「そんな装備で大丈夫か?」という質問に対し、初音ミクが「大丈夫だ、問題ない」とガッツポーズで返すパターンを仕込んでもらっていた(関連記事)。
(次ページに続く)

この連載の記事
-
第4回
AV
Silverlightで5.1chサラウンド! SRSの新技術 -
第3回
スマホ
最新スマートフォンから未来技術までCEATECで見たケータイ -
第2回
スマホ
ケータイ向けの新放送!? マルチメディア放送とは? -
第1回
AV
3D一色!? CEATECで体験する最新テレビ -
AV
CEATEC JAPAN 2010レポート - この連載の一覧へ