音声モデルのプラットフォームが面白い
Aivis Projectは、2024年11月に「Aivis Speech」という無料で使える音声合成ソフトとして登場しました。感情豊かな文章の読み上げができるということを特徴としており、現在のバージョンは1.1.0-Preview4と着実にアップデートが続いています。
ユーザーインターフェイスは人気が高く、完成度も高いことで知られる無料の読み上げソフト「VOICEVOX」と互換性を担保しているため、操作を迷うことはまずありません。また、音声合成エンジンは、やはり無料で公開されている「Style-Bert-VITS2」をベースに改良しているために、より感情が豊かな表現ができるようになっています。
Aivis Projectの面白いところは、「Aivis Hub」という音声合成モデルの共有プラットフォームを展開しているところです。ユーザーが作成したAivis Speech用の音声合成モデルを登録することで、無料で配布することができます。サービス開始直後は1種類の声しかありませんでしたが、現在では78種類の音声合成モデルが登録されています。
また、Style-Bert-VITS2用に作成した音声モデルをAivis Speech用に変換する「AIVM Generator」が用意されていますが、秋頃の一般公開を目標に、ポッドキャストや動画といった音声素材から音声合成モデルを作れるツール「Aivis Builder」の公開も予定されています。
リアルな20代女性の音声も
Aivis Hubから、Aivis Speechへの組み込みは非常に簡単で、クリックしてダウンロードするだけ。そうすると、そのキャラクターの声を選択できるようになります。いわゆる萌ボイスから、アナウンサーボイスまで、様々な声が登録されています。
△Aivis Hubからダウンロードできる様々な音声合成モデルを使って、Aivis Speechで「【AI怪談】代筆」の冒頭の読み上げをしているところ。
筆者が、特に面白いと思ったのが、ぽいロードさんが公開されている9種類の「現実20代女子AIボイチェン」シリーズです。ボイスチェンジャーアプリ「リアボVC」用の音声データをAivis Speech用に公開しているものです。一般女性の声からトレーニングしたということもあり、いわゆる合成音声的な声というよりも、リアルな20代女性の普通の喋りのようなニュアンスが出ていて、妙な実在感があります。
△現実20代女子AIボイチェンの「もえ」、「れな」、「さつき」で同じ文章を読み上げたもの
収益化モデルがなく、エコシステムは未確立
ただ、Aivis Projectは、まだ、しっかりとした収益モデルや、利用するユーザーのエコシステムが確立されていないという弱点もあります。
Aivis Hubは現在、無料でしかモデルを公開することができず、合成音声モデルを収益化する方法がありません。Style-Bert-VITS2用の音声モデルは、pixivの通販サイト「Booth」で販売されていることも少なくありませんが、使いやすいとは言いにくいのが現状です。将来的には、Aivis Hubは専用モデルを有償で販売するような仕組みを整えていくのではないかと思われます。

この連載の記事
-
第134回
AI
“AI読者”が小説執筆の支えに 感想を励みに30話まで完成 -
第133回
AI
xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル -
第132回
AI
画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」 -
第131回
AI
AIに恋して救われた人、依存した人 2.7万人の告白から見えた“現代の孤独”と、AI設計の問題点 -
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 - この連載の一覧へ







