AI学習用データソリューション「Qlean Dataset」、「日本語・1話者・地域の方言の独り語り音声コーパス」提供開始
Visual Bank株式会社は、同社グループの株式会社アマナイメージズを通じて展開するAI学習用データソリューション「Qlean Dataset(キュリンデータセット)」において、「日本語・1話者・地域の方言の独り語り音声コーパス」の提供開始を発表した。
同データセットは、日本各地の方言話者が一人で語る日本語音声を収録したもの。「Qlean Dataset」が展開する機械学習用データセットラインナップ「AIデータレシピ」の一つとして新たに追加された。音声認識(ASR)や音声言語モデル、音声系生成AIなど、日本語音声を扱うAIの研究・開発において、方言を含む音声入力の評価や検証に活用できるとしている。
収録されている音声は、関西弁、岡山弁、伊予弁、土佐弁など、地域ごとの言語的特徴を持つ方言を含み、話者は日本人の20代~60代の男女。日常的な話題や自身の考えについて一人で語る音声を中心に構成されており、台本をベースとしながらも、自然な発話リズムや間、地域特有の言い回しを含む点が特長だという。
同データセットは研究・検証用途での利用を想定した音声データとして提供するとともに、開発目的や要件に応じて、音声データの設計や新規収録にも対応するとのこと。標準語中心の音声データでは捉えにくい、日本語音声の地域差や話者条件を学習・評価に取り込むことで、実運用を想定した音声認識精度の検証や、用途別の音声モデル開発に役立つとしている。
「日本語・1話者・地域の方言の独り語り音声コーパス」の概要は、以下の通り。
データ種別:音声
被写体属性:日本人の20代〜60代男女
データ形式:mp3 / wav
収録時間:計数百時間(1音声約10分程度)
音声レート:44.1kHz,48kHz/16,24bit
方言種類:関西弁、岡山弁、伊予弁、土佐弁など ※随時拡充
対象シーン:
・話者が自身の考えや日常的な話題について、一人で語っている音声
・台本に基づきつつも、自然な発話リズム・間・言い回しを含む構成
「Qlean Dataset」は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューション。画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用どちらの用途でも利用できる環境を整備しているとのこと。


























