このページの本文へ

音声・音響信号処理の国際学会で論文採択

追加学習不要!LINE WORKSが専門・社内用語の音声認識を向上させる技術を開発

2024年07月31日 17時30分更新

文● ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 LINE WORKSは、2024年7月31日、音声・音響信号処理における世界最大規模の国際学会「INTERSPEECH 2024」にて新技術「InterBiasing」を考案した論文が採択されたことを発表した。

 同技術は、人名、業界特有の専門用語、社内用語といった、“学習データに存在しない”単語やフレーズを高精度で音声認識できるというもの。追加学習を必要とせず、事前にキーワードリストを与えるだけで、音声認識の精度を向上させる。

 同技術では、複数のニューラルネットワーク層からなるEnd-to-End音声認識モデルの中間層に、認識させたいキーワードを条件付け、後続の層では与えられたキーワードを参考にしながら発話内容を推定する。これにより、End-to-End音声認識モデルが出力するトークンの事後確率分布を認識させたいキーワードが高い値を持つようにバイアスすることができ、追加学習なしでキーワードの認識精度を向上させる。

「InterBiasing」の概要図、2つのステップで構成される

  LINE WORKSは、本技術をさらに発展させていき、音声認識技術の可能性を広げると共に、コミュニケーションツール「LINE WORKS」やAI製品への適用、新たな機能・サービスの創出を進めていく。

■関連サイト

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    TECH

    Claude CodeのPlan modeをやめてみる ~grill-meスキルで一歩ずつ設計を固め、アプリを作る~

  2. 2位

    ネットワーク

    「手のひらネットワーク機器」第4弾が登場、テーマは“ShowNetを手のひらに”! こだわりの両面マウントや高密度ポートも 6月11日発売

  3. 3位

    デジタル

    「そんなことも知らんで、介護やってるんですか?」 救急隊員の一言からkintone×AIの組織変革が始まった

  4. 4位

    TECH

    Obsidianで構築したエンジニアの「第二の脳」― 個人ナレッジベース構築のすべて

  5. 5位

    TECH

    FortiGateの圧倒的シェアをサプライチェーン防御に生かす フォーティネット 2026年度事業戦略

  6. 6位

    デジタル

    ブラックスケルトンモデルも登場!ヤマハ初のWi-Fi 7対応AP「WLX333」「WLX232」投入

  7. 7位

    ITトピック

    AIによるソフト開発加速の裏で「未テストの本番投入」も増加/「AIで日常生活が変わった」まだ45%/企業のコンサルへの不満、ほか

  8. 8位

    TECH

    出自で決まる「SASE」の最適解 主要外資ベンダー5社のコンセプトと強み

  9. 9位

    ビジネス・開発

    「デザインの仕事は半減するかもしれない」 MIXIデザイン本部が挑む「AIネイティブなものづくり」への転換

  10. 10位

    ビジネス・開発

    急増するトークン消費にマルチモデル化 AI活用は“見える化”してから広げる時代に

集計期間:
2026年06月03日~2026年06月09日
  • 角川アスキー総合研究所