このページの本文へ

オトバンク、PKSHAの技術を採用したAI音声合成サービス「カタリテ」開始

2021年07月16日 18時00分更新

文● 大谷イビサ 編集●ASCII

  • この記事をはてなブックマークに追加
  • 本文印刷

 音声配信サービス「audiobook.jp」を運営するオトバンクは、機械学習/深層学習領域のアルゴリズムに強みを持つPKSHA Technologyの音声技術を元に、コンテンツの音声化に対応する独自のAI音声合成サービス「カタリテ」を発表した。

 カタリテでは、PKSHAが開発した音声合成プラットフォーム「PKSHA Phonetics」を採用し、オトバンクの保有するオーディオブックの音声データベースを学習させることで音声合成を実現した。自然な発音を再現するPKSHAのアクセント推定技術「tdmelodic」を初めて実用化。また、語り手(朗読者)には、アニメーション作品や報道番組のナレーションなど幅広い作品で活躍する人気声優の浅野真澄さんを起用した。オトバンクのオーディオブックディレクターがチューニングを実施することで、より自然で聴き心地のいい音声を実現しているという。

カタリテの概要

 また、7月14日より「日経電子版」と連携してサービスの実証実験を開始した。「日経電子版」の速報コーナーで配信された記事の一部を抽出し、その見出しから生成した音声コンテンツを、オトバンクが運営する「audiobook.jp」の聴き放題プランにて配信する。

 今後は、最新の音声合成技術を活用することで、収録から編集に必要な制作時間を短縮し、即時性の高いコンテンツも適時に音声化し、提供できる環境の実現を目指すという。

■関連サイト

カテゴリートップへ

ピックアップ