メルマガはこちらから

PAGE
TOP

Qlean Dataset、「日本語・2話者・コメディテーマトーク音声コーパスデータセット」を提供開始

PR TIMES

Visual Bank株式会社
~GENIAC採択企業のVisual Bank、2者のリアルな日常会話音声コーパスで音声対話AI・自然言語処理の高度化を支援~




Visual Bank株式会社(東京都港区、代表取締役CEO 永井真之、以下「Visual Bank」)は、傘下の株式会社アマナイメージズを通じて展開するAI学習用データソリューション『Qlean Dataset(キュリンデータセット)』において、『日本語・2話者・コメディテーマトーク音声コーパスデータセット』の提供を開始しました。
本データセットは、Qlean Datasetが展開する機械学習用データセットラインナップ『AIデータレシピ』の1ラインナップとして提供されるもので、20代~50代の男女2名による日本語の自然対話音声を収録しています。
収録音声は、ユーモアや笑いを交えた軽快な掛け合いを中心とした雑談形式の対話で構成されています。台本を用いない自由な会話進行により、即興的な反応やテンポの変化、話題の脱線、ボケ・ツッコミといった自然な対話要素が含まれています。
こうした会話には、2話者構成による発話の交替や重なりも含まれており、ターンテイキング解析や話者識別、対話構造理解などのモデル学習および検証に利用できます。
また、本データセットは、リラックスしたコミュニケーション環境下での会話を想定して収録されています。そのため、実運用に近い条件で、音声認識(ASR)や自然言語処理(NLP)を基盤技術として用いる対話型AIや音声アシスタントなど、音声対話AIの研究・開発に活用できます。

今回提供を開始する「日本語・2話者・コメディテーマトーク音声コーパスデータセット」の概要


「日本語・2話者・コメディテーマトーク音声コーパスデータセット」のユースケースイメージ

【研究用途】

- 対話構造解析モデルの研究
2話者間での発話交替や話題遷移を対象に、ターンテイキングや対話単位の分割など、対話構造解析手法の検証に利用できます。
- 雑談対話を対象とした自然言語処理研究
台本に依存しない雑談対話を用い、非タスク指向対話における話題展開や応答生成の挙動を評価する研究に活用できます。

【産業用途】

- 音声対話AIの応答生成・理解モデル開発
音声アシスタントや対話型サービスにおいて、自然な会話の流れを前提とした応答生成・理解モデルの学習や評価に利用できます。
- 話者識別・ターンテイキング技術の検証
2話者による会話音声を用い、話者交替検出や発話区間推定など、対話制御に関わる技術の検証に活用できます。

【その他実需要】

- 音声処理・対話AI教育用データ
大学や専門教育機関における音声認識や対話AIの演習用データとして、対話特有の処理課題を扱う教材に利用できます。


『Qlean Dataset(キュリンデータセット)』について
『Qlean Dataset』は、Visual Bank傘下の株式会社アマナイメージズが提供する商用利用可能なAI学習用データソリューションです。
画像・動画・音声・3D・テキストなど、多様な形式のデータに対応し、研究・商用いずれの用途でも安全に利用できる環境を整備しています。
また、株式会社千葉ロッテマリーンズや株式会社東洋経済新報社をはじめとするデータパートナーとの協業を通じ、業界特化・最新トレンドに即したデータラインナップ『AIデータレシピ』を継続的に拡充しています。
Qlean Datasetは、AI開発現場におけるデータ収集・整備の負荷を軽減し、権利クリアで法的リスクのないAI開発環境の構築を支援します。
▶ Qlean Datasetサイト:https://qleandataset.visual-bank.co.jp/
▶ AIデータレシピ:https://qleandataset.visual-bank.co.jp/lineup












『Qlean Dataset』の提供するデータセット『AIデータレシピ』の特徴
- すべての被写体から同意取得
- 既存データは最短1日で納品可能
- カスタム撮影・収録・収集による独自データ構築にも対応

お問い合わせ
Visual Bank株式会社
AI開発力を最大化する次世代型データインフラを構築・提供するスタートアップ企業として、「あらゆるデータの可能性を解き放つ」をミッションに掲げ事業活動を展開。漫画家の「もっと描きたい!」をサポートするAI補助ツールを提供する『THE PEN』の他、AI学習用データセット開発サービス『Qlean Dataset(キュリンデータセット)』を提供する株式会社アマナイメージズを100%子会社に持つ。
また、Visual Bankは国の研究開発プログラム「GENIAC」にも採択され、社会実装に向けた取り組みを加速させています。

代表取締役CEO:永井 真之
所在地:〒107-0062 東京都港区南青山7-1-7 C-Cube南青山ビル6F
Visual Bank企業URL:https://visual-bank.co.jp/
アマナイメージズ企業URL:https://amanaimages.com/about/

【Translation】



Qlean Dataset Launches Japanese Two-Speaker Comedy Dialogue Speech Corpus
A Natural Conversational Dataset for ASR, Conversational AI, and Dialogue Modeling

Visual Bank Inc. (Minato-ku, Tokyo; CEO: Saneyuki Nagai; hereinafter “Visual Bank”) has launched the Japanese Two-Speaker Comedy-Themed Dialogue Speech Corpus Dataset as part of its AI training data solution, Qlean Dataset, which is operated through its subsidiary, Amana Images Inc.

This dataset is offered as one of the lineups within AI Data Recipe, Qlean Dataset’s machine learning dataset collection. It contains natural Japanese dialogue speech recorded by two speakers-male and female individuals in their 20s to 50s.
The recorded audio consists of casual, comedy-style conversations characterized by humor, laughter, and lively exchanges. Because the dialogues progress without scripts, the dataset captures spontaneous reactions, variations in conversational tempo, topic digressions, and natural comedic elements commonly found in real-world Japanese conversations.
The conversations include natural speaker turn-taking as well as overlapping speech between the two speakers. These characteristics make the dataset suitable for training and evaluation tasks such as turn-taking analysis, speaker identification, and dialogue structure modeling.
All recordings were conducted in relaxed communication settings that resemble real-world usage scenarios. As a result, the dataset can be used under conditions close to actual deployment environments for research and development of conversational AI systems, speech assistants, and dialogue-based applications that rely on automatic speech recognition (ASR) and natural language processing (NLP) technologies.

Overview of the “Japanese Two-Speaker Fashion & Beauty Dialogue Speech Corpus”



Use Case Examples for the Japanese Two-Speaker Comedy Dialogue Speech Corpus

For Research Applications

- Dialogue Structure AnalysisThis dataset can be used to evaluate dialogue structure analysis methods, including turn-taking detection, speaker alternation, and segmentation of conversational units between two speakers.
- Natural Language Processing Research on Casual DialogueBy using unscripted casual conversations, researchers can study topic development and response generation behaviors in non-task-oriented dialogue systems.

For Industrial Applications

- Response Generation and Understanding Models for Conversational AIThe dataset can be used to train and evaluate response generation and dialogue understanding models for voice assistants and conversational services that require natural conversational flow.
- Speaker Identification and Turn-Taking TechnologiesTwo-speaker conversational audio enables validation of speaker change detection, utterance boundary estimation, and other dialogue control-related technologies.

For Educational and Practical Use

- Educational Data for Speech Processing and Dialogue AIThe dataset can serve as training material for speech recognition and conversational AI courses at universities and professional education institutions, allowing learners to work with real dialogue-specific processing challenges.


About Qlean Dataset
Qlean Dataset is a commercial-use-ready AI training data solution provided by Amana Images Inc., a subsidiary of Visual Bank Inc.
It supports a wide range of data types, including images, videos, audio, 3D assets, and text, enabling both research and commercial AI development in a legally safe environment.
Through collaborations with data partners such as Chiba Lotte Marines Co., Ltd. and Toyo Keizai Inc., Qlean Dataset continues to expand its specialized, industry-focused lineup known as the “AI Data Recipe.”
By reducing the operational burden of data collection and preparation, Qlean Dataset helps organizations establish AI development environments that are both legally compliant and risk-free.
▶ Qlean Dataset: https://qleandataset.visual-bank.co.jp/en
▶ AI Data Recipe: https://qleandataset.visual-bank.co.jp/en/lineup












Key Features of Qlean Dataset
- Existing datasets deliverable within one business day
- Custom data collection and recording services available

Contact

About Visual Bank Inc.
Visual Bank Inc. is a Tokyo-based startup building Next-Generation Data infrastructure to enhance AI development capabilities under the mission “Unlocking Data Accessibility.”
The company operates THE PEN, an AI-assisted creative tool for manga artists and the Qlean Dataset service.
Its subsidiaries include Amana Images Inc., one of Japan’s largest photostock providers; Qlean Dataset, which leads research and development in AI data; and THE PEN Inc., an AI-assisted creative tool for manga artists.

CEO: Saneyuki Nagai
Address: 6F, C-Cube Minami Aoyama Building, 7-1-7 Minami-Aoyama, Minato-ku, Tokyo
Corporate Site: https://visual-bank.co.jp/en
Amana Images: https://qleandataset.visual-bank.co.jp/en/company-overview