このページの本文へ

前へ 1 2 3 次へ

CEATEC JAPAN 2010レポート ― 第5回

ネットの力、お借りしたい――初音ミクと話せる「MMDAgent」

2010年10月08日 12時00分更新

文● 広田稔

  • この記事をはてなブックマークに追加
  • 本文印刷

 「歌ってもらえますか?」 「もちろんです!」――。

 5日から開催されている「CEATEC JAPAN 2010」。こじんまりしたスペースながら、人だかりを作っていたブースがある。名古屋工業大学・国際音声技術研究所だ。研究所が今回発表したのは「MMDAgent」、ズバリ画面の3Dキャラクターと対話できるシステムだ。

 「こんにちは」とマイクに向かって話しかけると、キャラクターがお辞儀をしながら「こんにちは」と返してくれる。冒頭のやりとりを終えると、CGアイドル・初音ミクが踊りはじめた。

MMDAgent。これは初音ミクの3Dモデルを使った場合。マイクに向かって話しかけると、あらかじめ設定しておいた動きと返事を返してくれるこちらは「めいちゃん」という3Dモデル。名古屋工業大学の学内を案内してくれるように設定されている

CEATEC会場で「MMDAgent」を試してみた!

 とはいえ対話システムそのものは、長年研究がつづけられてきた分野。「MMDAgent」のどこが新しいのだろう。そして何より、なぜわざわざ「初音ミク」なのか? 徳田恵一教授にお話を伺ったところ、日本のネットユーザーへの期待感が見えてきた。


MMDAgent ここがスゴい5つのポイント

 MMDAgentが目指したものは「臨場感のある音声対話システムを誰でも作れること」だ。初めに、そのスゴさを5つに分けて紹介したい。


1. 人間っぽい対話ができる

 まずは人と話している感覚にものすごく近いことだ。

 返事の反応がとにかく早い。これまでのシステムは、質問をすべて聞いてからワンテンポ置いて返事をする、というタイプのものが多かったが、MMDAgentはユーザーの質問が終わると同時に答えられるようになっている。

 また、MMDAgentが答えている最中に話しかけられるのもポイント。「今日の天気を教えて!」という質問に答えている最中に「あ、やっぱり明日の天気を教えて」と言いなおしても、すぐさま「わかりました」と答えてくれる。

大型ディスプレーを使って等身大で表示していたので、かなりリアルに近い印象

 話し方も一定ではなく、怒りや悲しみといった「感情」が変化させられる。3Dモデルのモーションもなめらかで表情も人間に近い。大型ディスプレーに等身大で表示されているため、機械っぽさがかなり減っている。


2.対話をすぐに作れる

 次は、「対話スクリプト」という単純なコードを入れるだけで、会話が作れること。

 必要なのは「どういう言葉を認識したら」「どう動いて」「どう返事をするか」の3点だけ。もちろん、より複雑な動作や応答を定義したり、一連のやりとりをつなぎ、会話がどんどん進んでいくようなストーリーを構築することもできる。

 取材現場でたまたま一緒にいたニコニコ動画の有名人・伊予柑さんは、スタッフにお願いして「そんな装備で大丈夫か?」という質問に対し、初音ミクが「大丈夫だ、問題ない」とガッツポーズで返すパターンを仕込んでもらっていた(関連記事)。

対話スクリプトの画面。画面中央あたりに「装備」「大丈夫」をキーに、初音ミクが「大丈夫だ、問題ない」と答えるプログラムが書かれている


(次ページに続く)

前へ 1 2 3 次へ

この特集の記事

ASCII.jpメール デジタルMac/iPodマガジン

ASCII.jp RSS2.0 配信中

ピックアップ

富士通パソコンFMVの直販サイト富士通 WEB MART