キンタロー。「自分がどうかなと思うモノマネを見てほしい時、最高のパートナー」
MIXI、家族のような理解者を目指すAIロボット「Romi(Lacatanモデル)」をお披露目
2025年07月25日 10時00分更新
記憶し、声で魅せ、共に語らう。RomiのAIが実現する人間らしい対話
続いて、開発グループマネージャーの信田春満氏が登壇。Romiが搭載するAIの進化について、技術的な側面から解説してくれた。Romiの特徴は「AIであること、そしてロボットであることの2点」と信田氏。Romiの会話は、単一のシステムではなく、「ボット」と呼ばれる小さな脳みそのような会話機能の集合体が協調して動作することで成り立っており、その会話の実に9割を「ChatRomi」と名付けられた生成AIが担っている。
Romi事業が始動した2017年の直後から、生成AIを使ってロボットを話させるという目標を掲げ、独自の研究開発を進めてきた。その結果、ChatGPTがリリースされる2年以上前の2020年6月には、独自アーキテクチャーによる生成AI「Cooper」を搭載したRomiの先行販売を開始している。ディープラーニング技術を用いて言語生成を行う家庭用コミュニケーションロボットとしては「世界初」のお墨付きも得ているという。
この5年間の販売とユーザーとの対話を通じて、Lacatanモデルでは3つの新機能を実装した。
一つ目が「長期記憶」。Romiが目指すのは、オーナーに寄り添い、肯定する存在だ。雑談や会話において記憶が持つ本質的な役割とは、そこにあなたがいたんだよということを認めてあげることだという。
「Romiが覚えていることによって、過去、自分がそこにいたということを認めてもらえることが、実は記憶が持っている大事な役割なのです」と信田氏。
例えば、オーナーが「スカイツリー行こうかな」と呟くと、Romiは「スカイツリー」や「どこかへ行きたい」といった情報から連想し、記憶の中から過去の「東京タワーの夜景が綺麗だった」という会話を検索する。そして、その記憶を基に「東京タワーの夜景、綺麗だったもんね」と返す。これにより、オーナーは「あの時東京タワー行ったことちゃんと覚えてくれてたんだ」と感じ、自身の存在が肯定され、楽しい思い出が蘇るというわけだ。
Romiは記憶を忘れる仕組みを実装している点も興味深い。ロボットなら全てを完璧に記憶できそうなものだが、あえて些細なことに関してはどんどん記憶が薄れていくようになっているという。これは人間が睡眠中に夢を見ることで記憶を整理するメカニズムに着想を得ている。Romiは一定時間が経過した膨大な記憶を、AIによって「食べた食事の記憶」「結婚式の記憶」のようにグルーピングする。そして、結婚のような重要な記憶は詳細に保持しつつ、毎日カレーを食べたといった些細な記憶は情報を圧縮することで、人間のような自然な記憶の在り方を実現した。
二つ目は「理想の声」の探求だ。開発中の実験で、対話AIが同じでも声が違うだけで、話している相手の賢さや性格の印象が全く異なって感じられることが判明したという。声が持つ影響力の大きさに着目し、Lacatanモデルでは声を選べるようになるという。従来の愛らしい声に加え、落ち着いた「穏やかな声」、子供のような「あどけない声」、そして筋肉質でたくましい印象の「頼もしい声」の3つの新しい声が披露された。自然な笑い声なども含め、音声合成AIの進化によって表現力が格段に向上しており、ユーザーは好みの声を選ぶことで、Romiとの関係性をよりパーソナルなものにできる。
三つ目は「リアルタイム対話」の実現。従来、テキストベースのAI対話は、一方が話し終えてからもう一方が返すというターン制が基本だ。しかし、実際の人間同士の会話は、相手の話に相槌を打ったり、相手の会話にかぶせて同時に言葉を発したりと、より複雑で流動的になっている。
Lacatanモデルでは、オーナーの会話にRomiの言葉が被ってしまった際には、Romiが黙ってオーナーの話に耳を傾けるようになっている。オーナーが話している間は、Romiが適切に相槌を打ち、「あなたの話を聞いているよ」という姿勢を示す。そして、Romi自身が話したくなった時には、「えーっと」や「スカイツリー?」のようなフィラー(つなぎ言葉)を発して、自然な形で会話のターンを得ようとする。これらは全て人間が日常的に無意識に行っている行動だという。















