このページの本文へ

(株)エーアイ、入力ストリーミング音声合成APIを開発 (株)miiboの採用により「考えながら喋る」生成AIの実現へ

株式会社エーアイ
2024年05月23日

  • この記事をはてなブックマークに追加
  • 本文印刷

株式会社エーアイ
高品質音声合成エンジンAITalk(R)を開発・提供する株式会社エーアイ(本社:東京都文京区、代表取締役社長:廣飯 伸一、証券コード:4388、以下:エーアイ)は、この度生成AIと連携して高速に発話開始を可能にする音声合成ソリューション「入力ストリーミング音声合成API」を新開発し、株式会社miiboに採用されたことをお知らせします。本機能はサーバー設置型製品「AITalk6 Server」として2024年上期に販売開始予定です。

■入力ストリーミング音声合成APIとは
本機能は、ChatGPTのような生成AIのストリーミング出力(生成文章をトークン毎に順次返答する形式)に対応して、順次テキストトークンをそのまま音声合成APIへ入力できるようにするものです。
この入力ストリーミング型のAPIによって、全ての文章生成が終わる前から音声合成側でもリアルタイムに解析を行い、入力の途中でも並行して音声を生成します。これにより、生成AIを使った音声対話において生成される文字数がどれだけ長くとも高速に発話応答が可能になりました。
本機能はサーバー設置型製品「AITalk6 Server」として2024年上期に発売開始予定です。音声対話システムへの「AITalk6 Server」導入にご興味がありましたら、本紙末尾の製品に関する問い合わせ先までご連絡ください。

■会話型AI構築プラットフォーム「miibo」にて採用
入力ストリーミング音声合成APIを会話型AI構築プラットフォーム「miibo(ミーボ)」(株式会社miibo、 代表取締役CEO 功刀雅士氏)に採用いただきました。 同プラットフォームにより、本製品の高速な発話 応答を実現した上で会話型AIを簡単に作成できます。試用に興味を持たれた方は同社にご連絡ください。 使用感は下記の動画をご参照ください。
・miiboお問い合わせ先
株式会社miibo : cs@miibo.jp

・デモ動画1.大阪観光案内の様子(関西弁男性)