このページの本文へ

新清士の「メタバース・プレゼンス」 第118回

AIの「ASMRボイス」に脳ゾワゾワ 合成音声の進化と、収益化への課題

2025年08月04日 07時00分更新

文● 新清士

  • この記事をはてなブックマークに追加
  • 本文印刷

音声モデルのプラットフォームが面白い

 Aivis Projectは、2024年11月に「Aivis Speech」という無料で使える音声合成ソフトとして登場しました。感情豊かな文章の読み上げができるということを特徴としており、現在のバージョンは1.1.0-Preview4と着実にアップデートが続いています。

 ユーザーインターフェイスは人気が高く、完成度も高いことで知られる無料の読み上げソフト「VOICEVOX」と互換性を担保しているため、操作を迷うことはまずありません。また、音声合成エンジンは、やはり無料で公開されている「Style-Bert-VITS2」をベースに改良しているために、より感情が豊かな表現ができるようになっています。

 Aivis Projectの面白いところは、「Aivis Hub」という音声合成モデルの共有プラットフォームを展開しているところです。ユーザーが作成したAivis Speech用の音声合成モデルを登録することで、無料で配布することができます。サービス開始直後は1種類の声しかありませんでしたが、現在では78種類の音声合成モデルが登録されています。

 また、Style-Bert-VITS2用に作成した音声モデルをAivis Speech用に変換する「AIVM Generator」が用意されていますが、秋頃の一般公開を目標に、ポッドキャストや動画といった音声素材から音声合成モデルを作れるツール「Aivis Builder」の公開も予定されています。

Aivis Hubに公開されている音声合成モデル

リアルな20代女性の音声も

 Aivis Hubから、Aivis Speechへの組み込みは非常に簡単で、クリックしてダウンロードするだけ。そうすると、そのキャラクターの声を選択できるようになります。いわゆる萌ボイスから、アナウンサーボイスまで、様々な声が登録されています。

△Aivis Hubからダウンロードできる様々な音声合成モデルを使って、Aivis Speechで「【AI怪談】代筆」の冒頭の読み上げをしているところ。

 筆者が、特に面白いと思ったのが、ぽいロードさんが公開されている9種類の「現実20代女子AIボイチェン」シリーズです。ボイスチェンジャーアプリ「リアボVC」用の音声データをAivis Speech用に公開しているものです。一般女性の声からトレーニングしたということもあり、いわゆる合成音声的な声というよりも、リアルな20代女性の普通の喋りのようなニュアンスが出ていて、妙な実在感があります。

△現実20代女子AIボイチェンの「もえ」、「れな」、「さつき」で同じ文章を読み上げたもの

 

Aivis Hubに登録されているぽいロードさんの「さつき」

収益化モデルがなく、エコシステムは未確立

 ただ、Aivis Projectは、まだ、しっかりとした収益モデルや、利用するユーザーのエコシステムが確立されていないという弱点もあります。

 Aivis Hubは現在、無料でしかモデルを公開することができず、合成音声モデルを収益化する方法がありません。Style-Bert-VITS2用の音声モデルは、pixivの通販サイト「Booth」で販売されていることも少なくありませんが、使いやすいとは言いにくいのが現状です。将来的には、Aivis Hubは専用モデルを有償で販売するような仕組みを整えていくのではないかと思われます。

カテゴリートップへ

この連載の記事
ピックアップ