音声感情解析AI「Empath」活用で3Dキャラクタの表情アニメ工数を95%削減
音声感情解析AI「Empath」を提供する株式会社Empathは2023年4月12日、株式会社Luminous Productionsが開発したゲーム「FORSPOKEN」の制作時に3Dキャラクタの表情を台詞音声から解析する技術「DeepEmo」を提供し、表情アニメーターの工数を95%削減することに成功したと発表した。
現状、ゲーム制作において3Dキャラクタの表情アニメーションは、アニメーターが1つのキャラクタごとに手作業で表情を作成。そのためゲーム内に登場するキャラクタや台詞が多くなるほどアニメーターの工数が発生し、コストが高くなる傾向があるという。
Empathはこの課題解決のため、収録した台詞音声を解析。0.32秒ごとに変化する感情値を生成する技術「DeepEmo」を開発し、Luminous Productionsへ提供した。「DeepEmo」は、音声感情解析AIの「Empath」を活用。「Empath」が保有する感情表出音声をもとにディープラーニングを行い、9つの感情(平常、怒り、恐怖、嫌悪、喜び、悲嘆、信頼、興味、驚き)を推定するアルゴリズム。
Luminous Productionsは従来の方法だとアニメーター1人日で2分程度のセリフの表情アニメーションを作成していたが、「DeepEmo」を活用した結果、約95%の制作時間を削減できたとしている。これまで1000分の台詞をアニメーションさせる際には500人日の工数が必要であったが、「DeepEmo」の利用により25人日程度でアニメーション作業が完了することになるという。
Empathは今後、「DeepEmo」をゲーム制作活用のほか、メタバース、Vtubeなどのキャラクタの台詞から表情を生成するAIとして幅広く販売することを想定している。クライアントが保有する音声データのみ提供を受け、解析結果を出力する方式に加え、今後はSaaSサービスとしてAPI提供も想定中だという。
音声感情解析AI 「Empath」は、音声から話し方や感情を測定する国産の音声AI。「FORSPOKEN」は、PlayStation 5、Steam、Epic Games Store 、Microsoft Store用ゲーム。