メルマガはこちらから

PAGE
TOP

ニューラルグループ、クラウド不要でPC上でローカル動作する自動音声認識技術(ASR)を提供開始

 ニューラルグループ株式会社は10月23日に、PC上でローカル動作する高性能自動音声認識技術(ASR: Automatic Speech Recognition)を開発し、提供を開始したと発表。PC上で完全にローカル処理される音声データを、セキュアな環境下において高精度かつリアルタイムな文字起こしを行い、業務効率化と情報セキュリティの両立を図るという。また、同技術はニューラルグループが提供する1on1支援サービス「KizunaNavi」での導入を開始しているとのこと。

ASRの概念図

 同技術では、これまでにニューラルグループが培ってきた音声信号処理技術とトランスフォーマーモデルを組み合わせ、軽量なモデルサイズで高精度な音声認識を実現するという。従来のクラウド型ASRでは対応が困難だった機密性の高い会議やネットワーク環境が不安定な現場でも、安定した音声認識サービスを提供するとしている。

 また、同社によるとエッジ上で動作する日本語に対応した音声認識モデルは数が少ないが、同社のモデルは他社の既存モデルと同じエッジ環境で比較してCER(文字誤り率)が7.76%程度という精度を実現しており、実際のサービスに組み込んでユーザーが活用できる水準に達しているとのこと。今後、さらなるモデルの軽量化・専門用語辞書などへの対応を進めていく予定だという。

■関連サイト

合わせて読みたい編集者オススメ記事