EmbodyMe、ビデオ会議で画像アバターの表情が声で変化「xpression camera Voice2Face」開始
株式会社EmbodyMe(エンボディーミー)は2022年10月26日、AIで会話の音声を自分の外見に変換して、家事をしながらなど、どんな状況下でもビデオ会議などができる「xpression camera Voice2Face(エクスプレッションカメラボイストゥーフェイス)」を開始。自分の写真など好きな画像を1枚用意するだけで、表情や体の動きに合わせてAIがリアルタイムで映像を生成する。価格はデフォルトの顔画像や背景、アニメーションなど基本機能での使用は無料。録画機能や仮想背景のカスタマイズができる有料プランもあり。
EmbodyMeは、「Zoom」などのビデオ会議や、「Youtube」などのライブ配信で、カメラで顔の表情や体の動きを読みとり、自分の外見をAIで置き換えてリアルタイムにコミュニケーションできる「xpression camera」を提供してきた。「xpression camera Voice2Face」はさらに発展させ、カメラを使用しなくても音声だけを入力してリアルタイムで映像を生成。ボタンをクリックするだけで、対面ではできない多彩な動きを生成し、より豊かな感情を表現できる新技術「Voice2Face」を開発した。
「Voice2Face」は、カメラを使わずに音声だけで、リアルタイムで自分の外見を生成可能なため、リラックスした体勢、自由な環境でコミュニケーションできる。ビデオ会議疲れを軽減、解消できるとしている。そのため、家事や、ジョギングなどをしながらであったり、パジャマ姿のままであったりと、どのような状況でもビデオチャットができるようになる。
テキストから画像を生成する技術のみだと、イラストや漫画、アートといった市場にとどまるが、「xpression camera」を使うことで映画、テレビ、アニメ、ライブ配信、ビデオチャットといった映像全般の幅広い市場に可能性を広げられるとしている。
EmbodyMeは競合企業よりも50倍以上高速で、ビデオチャット、ライブ配信、ゲームなどでリアルタイム動作できるという優位性をさらに発展させていくとしている。