DMMグループの合成音声サービス「にじボイス」
一方で、国内のAI合成音声サービスとして使いやすさから注目を集めながらも、一定の不便さがあってもクローズドな仕組みへと転換を図ろうとしているのが、DMMグループのAlgomaticが展開する「にじボイス」です。
2024年11月に公開が始まったクラウドAIサービスは、すでに120種類もの音声が用意されており声の豊富さを誇っています。技術的な情報は公開されていませんが、やはりStyle-Bert-VITS2をカスタム化したものではないかと推測しています。アニメ系の声が多い印象ですが、ベースとなる音声の水準が高いためか、全体的にどの音声も品質が高い印象です。
複雑な音声編集モードは存在しておらず、読み上げてほしいテキストを入力し、ボタンを押すだけで、数秒でその音声が出来上がるので、ダウンロードして使う形になります。非常に簡単操作でできるために、動画AIなどの音声として手軽に使われています。
△にじボイスで音声を生成して再生している様子。選択したキャラクターが右ウィンドウに表示される
私の音声、何に使うの? 不安感から“審査制”に
そのにじボイスが、7月30日に「審査制サービス」へ移行するという発表をしました。10月1日以降は、有料プラン登録ユーザーで審査に通った方のみが利用可能にするというものです。月1000文字まで認められていた無料プランの終了も明らかにされています。
リリースでは、審査制への移行理由を「自分自身の声の利用範囲が見えづらいことに対する懸念が想定以上に大きいことが声の提供の妨げとなっている」としています。過去、にじボイスは品質の高いAI合成音声を確保するために、積極的に声の提供者の募集をしていたのですが、自分の声が何に使われるのかわからないという不安感が、提供者を確保しにくいという問題になっていることが伺えます。
AI合成音声は感情表現の能力が高まってきているとはいえ、まだまだ、現実の人間ほどは豊かな表現はできないのですが、それでも、性的な言葉を読み上げたりというケースは増えていると言われています。そうした利用ケースを音声の提供者がコントロールできないのは、不安を感じやすい部分なのかもしれません。
審査基準がどのような形で運用されるのかは、まだはっきりとしません。ただ、にじボイスが、AI合成音声でビジネスを広げていくために解決しなければならない課題が存在することが感じられます。

この連載の記事
-
第134回
AI
“AI読者”が小説執筆の支えに 感想を励みに30話まで完成 -
第133回
AI
xAIの画像生成AI「Grok Imagine」が凄まじい。使い方は簡単、アダルト規制はユルユル -
第132回
AI
画像生成AI:NVIDIA版“Nano Banana”が面白い。物理的な正確さに強い「NVIDIA ChronoEdit」 -
第131回
AI
AIに恋して救われた人、依存した人 2.7万人の告白から見えた“現代の孤独”と、AI設計の問題点 -
第130回
AI
グーグルNano Banana級に便利 無料で使える画像生成AI「Qwen-Image-Edit-2509」の実力 -
第129回
AI
動画生成AI「Sora 2」強力機能、無料アプリで再現してみた -
第128回
AI
これがAIの集客力!ゲームショウで注目を浴びた“動く立体ヒロイン” -
第127回
AI
「Sora 2」は何がすごい? 著作権問題も含めて整理 -
第126回
AI
グーグル「Nano Banana」超えた? 画像生成AI「Seedream 4.0」徹底比較 -
第125回
AI
グーグル画像生成AI「Nano Banana」超便利に使える“神アプリ” AI開発で続々登場 -
第124回
AI
「やりたかった恋愛シミュレーション、AIで作れた」 AIゲームの進化と課題 - この連載の一覧へ





