音声生成技術と言えばヤマハの「ボーカロイド」などが思い浮かびますが、今年大きな話題となったのが、4月に公開された中国製と思われる「RVC(Retrieval-based Voice Changer)」。RVCが画期的だったのは、2〜10秒くらいの音声を50パターンほど作れば学習ができてしまうこと。しかもクオリティが非常に高いということで、自分で音声を学習させてモデルを作るのがブームになり、そこから日本でも「音声販売」市場が急速に立ち上がりかけています。
自分の声を「音声モデル」として販売するマーケットの登場
たとえばピクシブの創作物の総合販売サイト「BOOTH」で検索すると、販売されているRVC用の学習済み音声モデルが約130件登録されています。たとえば「解説・実況・朗読向け」として音声を公開していたり、歌声対応も公開していたり。販売値段は、無料から数千円と幅がありますが、今のところBOOTHで販売されている音源は基本的にアマチュア的な傾向が高いようです。声優を目指している方が、二次創作として使ってほしいという目的で公開されている人もいるようです。特に、バーチャルYouTuberやVRChatなどで、自分の音声を変えたいというニーズがあったことがこうした市場の登場の背景になっています。
精度の高い音声データさえきちんとそろえることができれば、数時間の学習プロセスで学習データを作り出すことができるわけです。

この連載の記事
-
第94回
トピックス
1000円あればOpenAIレベルのAIが作れる DeepSeekで注目の「蒸留」とは -
第93回
AI
DeepSeek R1、無料で使えるAIとしては最強クラス -
第92回
AI
動画生成AI、ついにアダルトの扉が開く -
第91回
AI
AIの書いた小説が普通に面白い ChatGPT「o1」驚きの文章力 -
第90回
トピックス
画像生成AIで年賀状 リアルな人物も簡単に -
第89回
AI
OpenAI「Sora」残念な離陸 中国勢が飛躍する動画生成AI -
第88回
AI
1枚の画像から、歩き回れる“世界”ができる 来年のAIは「ワールドモデル」がやばい -
第87回
AI
画像生成AIの進化が早すぎる 2024年に起きたことまとめ -
第86回
AI
イラストに強すぎる画像生成AIモデル SDXL系「NoobAI-XL」の衝撃 -
第85回
AI
3DモデリングにAI革命の兆し 1枚のイラストから3Dデータが完成 -
第85回
AI
誰でもVTuber時代へ フェイシャルAI技術、続々登場 - この連載の一覧へ