rinnaは5月20日、AIアバターと大言語モデル(LLM)、音声合成を組み合わせた新ソリューション「Virtual Human Talk」の提供を開始した。
本サービスは、同社のLLMソリューション「Tamashiru Custom」で学習したAIモデルとアバターを連携し、任意のデータで学習したLLMによりキャラクター性や知識に基づいた対話ができる。
音声は同社の音声合成ソリューション「Koemotion」と接続。Koemotionで用意した音声や、サードパーティー製のTTS(テキスト音声変換)サービスの音声を活用できる。さらにオプションを実装すれば、実在する人物の音声データから合成した音声もアバターに実装可能だ。
AIアバターになる人物や、用途に合わせた知識データで学習したLLMによる再現度の高いコミュニケーションを実現できる点が特徴。スマホやPCブラウザー上に設置でき、幅広いシーンでAIアバターを活用できる。また、オプションで音声によるリアルタイムの対話の対話も可能。
さらに、同社が提供するバーチャルヒューマンソリューションの技術を応用して、スマホで撮影した録画データで対話型AIアバターも利用できる(要件により6分~の学習データが必要)。グリーンバックを利用した撮影データであれば、背景も変更できる。なお、初回導入時は、AIアバターの作成とLLMの開発が必要となる。
同社の既存サービスである「Virtual Human Solution」も、バーチャルヒューマン技術を用いたAIアバターソリューションだが、用途が異なるという。Virtual Human Talkは、ユーザーとの対話型AIをコンセプトにしており、AIアバターは音声を使ってユーザーとコミュニケーションする。一方、Virtual Human Solutionは、AIアバターを使った動画コンテンツの生成を目的とした動画生成・編集プラットフォームであり、AIアバターとの会話はできず、プレゼンテーション動画やSNS向けコンテンツの作成に特化している。
本サービスの活用シーンとして、著名人のアバター化や対話型アシスタント、相談窓口やユーザー対応ウェブシステム、インタラクティブ広告などが想定されている。