NTT ComのCOTOHA APIに言いよどみの除去や指示語検知など追加

2019年01月16日 11時00分更新

文● 大谷イビサ／TECH.ASCII.jp

　2019年1月15日、NTTコミュニケーションズは自然言語解析APIサービス「Communication Engine “COTOHA(R) API”」(以下「COTOHA API」）のラインナップを強化した。

　2018年9月より提供している「COTOHA API」は、AIによる自然言語解析API。NTTグループが40年以上にわたって蓄積・精錬した210万語を超える日本語辞書およびAI関連技術「corevo」と、NTT Comが独自開発した自然言語解析技術を実装する。構文解析／固有表現抽出／照応解析／キーワード抽出／類似度算出／文タイプ判定／ユーザー属性推定（β版）の7つのAPIを提供しており、今回新たに、言い淀み除去(β版)／音声認識誤り検知(β版)／感情分析（正式版）の3つを追加した。今回、新たに「言い淀み除去」「音声認識誤り検知」「感情分析」の3つのAPIを提供するほか、従来β版だった「照応解析」APIの正式版提供を開始する。

言い淀み除去 (β版）: 音声認識処理後のテキストデータの中から、「ええと」や「あのう」といった言いよどみを特定し、除去します。既存の音声認識エンジンやアプリケーションにアドオンすることで、音声認識結果の精度向上を実現する。
音声認識誤り検知 (β版): 音声認識処理後のテキストデータの中から、認識ミスの恐れがある単語※1を検知・抽出する機能。「認識した文章全体における誤り度合い」と「言い間違いや音声認識間違いの可能性が高い単語」をスコア化して表示します。本APIを活用することで、音声認識結果の信頼度判定を行なったり、AIが人に対して聞き返しを行なう際に不明点のみを尋ねることが可能となる。今後提供予定の「音声認識誤り訂正」APIと組み合わせることで、誤りを自動で訂正して、認識精度を向上できるという。
感情分析（正式版）: 文章が表現している感情を「ポジティブ」あるいは「ネガティブ」で判定する。否定語の認識をしながら、文章全体の意味を踏まえて分析するため、単語単位の判定と比べ高精度で感情を判定できるという。また、文章に含まれる「喜ぶ」「驚く」「不安」「安心」といった15種類の感情を分類・認識することも可能。
照応解析（正式版）: 「あれ」「彼／彼女」「同〇〇」「その〇〇」などさまざまな指示語を検知し、それらが指し示す対象を特定することができる。構文解析と組み合わせて利用することで、解析精度を向上させることが可能。従来β版を提供してきたが、今回の正式版にて、以下の例のように指示語が複数形の場合や、指示語のさす対象が複数の単語からなる場合などのさまざまな照応関係について認識できるようになった。