音声生成技術と言えばヤマハの「ボーカロイド」などが思い浮かびますが、今年大きな話題となったのが、4月に公開された中国製と思われる「RVC(Retrieval-based Voice Changer)」。RVCが画期的だったのは、2〜10秒くらいの音声を50パターンほど作れば学習ができてしまうこと。しかもクオリティが非常に高いということで、自分で音声を学習させてモデルを作るのがブームになり、そこから日本でも「音声販売」市場が急速に立ち上がりかけています。
自分の声を「音声モデル」として販売するマーケットの登場
たとえばピクシブの創作物の総合販売サイト「BOOTH」で検索すると、販売されているRVC用の学習済み音声モデルが約130件登録されています。たとえば「解説・実況・朗読向け」として音声を公開していたり、歌声対応も公開していたり。販売値段は、無料から数千円と幅がありますが、今のところBOOTHで販売されている音源は基本的にアマチュア的な傾向が高いようです。声優を目指している方が、二次創作として使ってほしいという目的で公開されている人もいるようです。特に、バーチャルYouTuberやVRChatなどで、自分の音声を変えたいというニーズがあったことがこうした市場の登場の背景になっています。
精度の高い音声データさえきちんとそろえることができれば、数時間の学習プロセスで学習データを作り出すことができるわけです。
この連載の記事
-
第61回
AI
画像生成AI“児童ポルノ”学習問題、日本では表現規制の議論にも -
第60回
AI
3Dアニメーション技術の革新が止まらない -
第59回
AI
政府、生成AI推進に向けて議論を加速 -
第58回
AI
画像生成AIで同じキャラクターが簡単に作れるようになってきた -
第57回
AI
日本発のリアルタイム画像生成AIサービスが熱い 大手にとっては“イノベーションのジレンマ”に -
第56回
AI
画像生成AIの著作権問題、文化庁議論で争点はっきり -
第55回
AI
動画生成AIの常識を破壊した OpenAI「Sora」の衝撃 -
第54回
AI
画像生成AI、安いPCでも高速に 衝撃の「Stable Diffusion WebUI Forge」 -
第53回
AI
日本発の画像生成AIサービスがすごい 無料アップスケーラー「カクダイV1」 -
第52回
AI
美少女イラスト、AI技術で立体化 ポケットサイズの裸眼立体視ディスプレーが人気に -
第51回
AI
“生成AIゲーム”急増の兆し すでに150タイトル以上が登録 - この連載の一覧へ