ネットの力、お借りしたい――初音ミクと話せる「MMDAgent」

2010年10月08日 12時00分更新

文● 広田稔

　「歌ってもらえますか？」「もちろんです！」――。

　5日から開催されている「CEATEC JAPAN 2010」。こじんまりしたスペースながら、人だかりを作っていたブースがある。名古屋工業大学・国際音声技術研究所だ。研究所が今回発表したのは「MMDAgent」、ズバリ画面の3Dキャラクターと対話できるシステムだ。

　「こんにちは」とマイクに向かって話しかけると、キャラクターがお辞儀をしながら「こんにちは」と返してくれる。冒頭のやりとりを終えると、CGアイドル・初音ミクが踊りはじめた。

MMDAgent。これは初音ミクの3Dモデルを使った場合。マイクに向かって話しかけると、あらかじめ設定しておいた動きと返事を返してくれる

こちらは「めいちゃん」という3Dモデル。名古屋工業大学の学内を案内してくれるように設定されている

　とはいえ対話システムそのものは、長年研究がつづけられてきた分野。「MMDAgent」のどこが新しいのだろう。そして何より、なぜわざわざ「初音ミク」なのか？　徳田恵一教授にお話を伺ったところ、日本のネットユーザーへの期待感が見えてきた。

MMDAgent　ここがスゴい5つのポイント

　MMDAgentが目指したものは「臨場感のある音声対話システムを誰でも作れること」だ。初めに、そのスゴさを5つに分けて紹介したい。

　まずは人と話している感覚にものすごく近いことだ。

　返事の反応がとにかく早い。これまでのシステムは、質問をすべて聞いてからワンテンポ置いて返事をする、というタイプのものが多かったが、MMDAgentはユーザーの質問が終わると同時に答えられるようになっている。

　また、MMDAgentが答えている最中に話しかけられるのもポイント。「今日の天気を教えて！」という質問に答えている最中に「あ、やっぱり明日の天気を教えて」と言いなおしても、すぐさま「わかりました」と答えてくれる。

大型ディスプレーを使って等身大で表示していたので、かなりリアルに近い印象

　話し方も一定ではなく、怒りや悲しみといった「感情」が変化させられる。3Dモデルのモーションもなめらかで表情も人間に近い。大型ディスプレーに等身大で表示されているため、機械っぽさがかなり減っている。

　次は、「対話スクリプト」という単純なコードを入れるだけで、会話が作れること。

　必要なのは「どういう言葉を認識したら」「どう動いて」「どう返事をするか」の3点だけ。もちろん、より複雑な動作や応答を定義したり、一連のやりとりをつなぎ、会話がどんどん進んでいくようなストーリーを構築することもできる。

　取材現場でたまたま一緒にいたニコニコ動画の有名人・伊予柑さんは、スタッフにお願いして「そんな装備で大丈夫か？」という質問に対し、初音ミクが「大丈夫だ、問題ない」とガッツポーズで返すパターンを仕込んでもらっていた（関連記事）。

対話スクリプトの画面。画面中央あたりに「装備」「大丈夫」をキーに、初音ミクが「大丈夫だ、問題ない」と答えるプログラムが書かれている

(次ページに続く)

前へ 1 2 3 次へ