メルマガはこちらから

PAGE
TOP

音声認識システム「TeamLog」リリース、複数人での会話の文字起こしや多言語の同時翻訳に対応

 株式会社聴覚研究所は4月13日に、音声認識システム「TeamLog」をリリースした。複数のマイクを使用する独自の仕組みで、最大9名の同時文字起こしに対応するほか、多言語での会話(現在は日・英・中・韓の4言語に対応)の同時翻訳が可能だという。PC要約筆記と組み合わせることで、難聴者への支援や、翻訳精度向上による日本語未収得の外国籍児童への修学支援などに取り組んでいるという。現在はiOS版のみの提供で、Android版とPC版を開発中とのこと。

「TeamLog」では、複数の指向性マイクを使用する独自の構造で、最大9名の同時文字起こしに対応するという。発言が重なったり会話の割り込みが発生したりしても文字起こし可能なほか、マイクに名前を付けることで「誰が何を話したか」が一目見てわかるよう表示するという。

1人ひとりにマイクを割り当てることで話者名と認識結果を同時に表示

 強い指向性を持つマイクにより、騒音や周囲の会話の影響を抑制。80dBの騒音環境下でも安定した文字起こしを行うとのこと。例えば工事現場やカフェなど雑音や他社の声が気になる場所でも、文字起こし精度にほとんど影響がないとしている。また、単語辞書を作成することで専門用語や人名に対応するほか、医療や金融などの専用エンジンを搭載しているという。

「TeamLog」はもともと難聴者の支援を目的として開発されたという。そうした知見も生かしながら、企業や組織など多様なユーザーにとって利便性の高い議事録や同時翻訳ツールなどの機能も備えているとのこと。

 日本語未収得の外国人児童への修学支援にも力を入れており、様々な国の言語にリアルタイムで翻訳できるように開発および検証を継続しているという。今後さらなる精度の向上、機能改善、幅広い分野への適応を目指していくとしている。

■関連サイト

本記事はアフィリエイトプログラムによる収益を得ている場合があります

合わせて読みたい編集者オススメ記事