使い勝手は洗練されており、実用性は高い
いろいろと試してみると、指示文(プロンプト)の自然言語解析に関しては今ひとつで、距離や環境について理解できないこともあった。しかし、これは画像生成AIなども同様である。おそらく現時点においては、自然言語解析には専用のAIが必要で、こうした音声などの生成には、また別の専用AIが必要なのだろう。そして、専門的なAIを掛け合わせていくことでより汎用的なAIが生まれていく。
また、これまで紹介した音楽生成AIは動作が不安定なものが多かった。どれも研究室からそのまま出してきたようなものだった。しかし、Audioboxはスムーズな動作でストーリー作成ツールも含めて、実用的に作られている印象を持った。つまり、AIもそれだけ社会に受け入れられつつあるということを作り手側も意識してきたのだろう。
Audiobox自体はデータ品質もまだ低く、短時間しか生成できないものの、新しい生成AIの普及に向けて時代が着実に進んでいるとも感じた。
この連載の記事
-
第300回
AV
インド発の密閉型/静電式ヘッドホン? オーディオ勢力図の変化を感じた「INOX」 -
第299回
AV
夏のヘッドフォン祭 mini 2024レポート、突然のfinal新ヘッドホンに会場がわく! -
第298回
AV
ポタフェス2024冬の注目製品をチェック、佐々木喜洋 -
第297回
AV
なんか懐かしい気分、あなたのApple WatchをiPodにする「tinyPod」が登場 -
第296回
AV
逆相の音波で音漏れを防げる? 耳を塞がないヘッドホン「nwm ONE」──NTTソノリティ -
第295回
AV
NUARLのMEMS搭載完全ワイヤレス「Inovatör」(旧X878)の秘密とは? -
第294回
AV
AirPodsで使用者の動きからBPMを認識、それを何かに応用できる特許 -
第293回
AV
次世代AirPodsにはカメラが付くらしい、じゃあ何に使う?(ヒント:Vision Pro) -
第292回
AV
OTOTEN発、LinkPlayの多機能ネット再生機「WiiM」とSHANLINGの「EC Smart」を聴く -
第291回
AV
ビクターの新機軸、シルク配合振動板の魅力とは? HA-FX550Tを聴く -
第290回
AV
HDTracksがMQA技術を使ったストリーミング配信開始へ - この連載の一覧へ