機械の「耳」を実現する音声AIテクノロジー「mimi(R)︎」のサービスサイトを全面リニューアルし、音声AIの社会実装に必要な技術知見を一般に公開
フェアリーデバイセズ
~業務現場で発生する多言語音声データを活かした現場DXのオープンイノベーションを加速化~
フェアリーデバイセズ株式会社(本社:東京都文京区、代表取締役:藤野真人、以下「フェアリーデバイセズ」)は、ビジネス向け音声AIテクノロジーとして豊富な実績を持つ「mimi(R)︎」のサービスサイトを全面リニューアルし、音声AIテクノロジーのビジネスへの応用に必要な全体の知見を一般に公開しました。
「mimi(R)︎」サービスサイト:https://mimi.fairydevices.jp/
「mimi(R)︎」は、フェアリーデバイセズ及び共同研究機関等の音声技術に関する研究成果の集大成であり、デジタルサイネージやロボット、各種設備機材等に文字通り機械の「耳」を実現するための音声AIサービス・製品群です。
ハードウェアからソフトウェアまで音声技術のデパートとも称されるほど多種多様なサービス・製品があり、幅広い多言語対応や高騒音環境での認識性能が評価され、これまで組み込み製品は累計5百万台以上に搭載され、クラウドサービスは累計数十億アクセス利用されてきた豊富な実績がありますが、その全容について当社ウェブサイト上で十分に表現されていないため、より分かりやすく知りたいというお声もいただいていました。
昨今、DXを推進するために音声AIテクノロジーの重要性がますます大きくなっていることも踏まえ、この度、「mimi(R)︎」の全容を分かりやすく伝えることに加え、音声AIテクノロジーを実際のビジネスに適用するためのポイントや事例など、当社製品紹介の枠を超えた音声AIテクノロジー応用全体の知見を一般に公開することを目的とし、「mimi(R)︎」サービスサイトの全面リニューアルを実施しました。
新サイトの3つの特徴
1.「mimi(R)︎」の全容を分かりやすく分類して紹介
「mimi(R)︎」には、ハードウェアからクラウドサービスまで音声ソリューションを開発するために必要となる全レイヤーのサービス・製品があります。これらを、「クラウドAI」「エッジAI」「デバイス」の3つに分類し、それぞれの分類の中で、個別のサービス・製品を紹介することで、「mimi(R)︎」の全容を把握しやすくまとめました。
クラウドAI :https://mimi.fairydevices.jp/technology/cloud/
エッジAI :https://mimi.fairydevices.jp/technology/edge/
音声デバイス:https://mimi.fairydevices.jp/technology/device/
2.典型的な音声ソリューション構成例を数多く紹介
当社はこれまで約10年間に渡り、デジタルサイネージやロボット、スマートスピーカー、スマートホーム、産業現場の各種設備をはじめとする数多くのお客様の音声応用製品・ソリューション開発を支援してきました。その中で得られた知見を、典型的なソリューション構成として、要素技術レベルから具体的かつ丁寧に解説を行っています。優れたユーザーインターフェースは、表からは簡単そうに見えますが、その裏には複雑かつ多層的な仕組みが存在しています。新たに音声応用製品・ソリューションを開発するため、音声AIテクノロジーの実際を理解するための参考としてご活用ください。
ソリューション一覧:https://mimi.fairydevices.jp/solution/
3. 分野全体を俯瞰できるコンテンツ
自社サービス・製品を一方的に紹介するだけでなく、それぞれの技術の仕組み、重要な概念の紹介や、技術自体の強み/弱みなど、自社技術に留まらず、他社技術も含め音声応用分野全体を俯瞰できるようなコンテンツ作成を行い、誰もが参照出来る形で一般に公開しています。
例)マイクアレイによる音声認識システム:https://mimi.fairydevices.jp/technology/cloud/asr/
サイトリニューアルの狙い
ChatGPT に代表される大規模言語モデルが大きな話題となっているように、昨今のAI技術の進化に伴い、実際のビジネス現場に音声AI技術を適用し、DXの一環として対話・音声データを活用したいというニーズはますます高まっています。しかしながら、実際の業務現場では、多言語対応や略語・専門用語対応に加え、そもそもマイクを配置することが困難であったり、音声品質が悪かったり、極めて騒音が大きく音声認識が困難であったりするなど、対話・音声データの利活用は一筋縄ではいかないということも、元然たる事実です。
当社は過去10年に渡り、そのような難しい課題に対して、その時々の最新技術を適用してソリューションを生み出してきました。その中で必要となり開発されたコア技術を「mimi(R)︎」として標準化しており、近年は、共同研究先や国研等の協力を得て「mimi(R)︎」の提供サービスはますます幅広くなっています。
しかしながら、「mimi(R)︎」の専門性が故に、本来必要とするお客様に十分認知されないという状況が続いていました。このため、他社と取り組んで一度失敗したお客様から、開発プロジェクトの最終段階になって駆け込み寺のように改めて依頼を頂くということも数多くあり、「プロジェクト初期から共同で取り組めていたなら、性能もコストも圧倒的に優れたものを実現できたのに」といった声を多く頂いて参りました。
このような状況を打破し、対話・音声データを活かした新しい現場DXを強力に推進し、ひいては社会全体の効率化と生産性の向上につなげるため、本リニューアルでは、当社「mimi(R)︎」の網羅的な紹介に留まらず、この分野全体を俯瞰できるような知見・コンテンツの公開を行いました。今後も、当社の直接のお客様だけでなく、この分野に関わる製品企画やエンジニア、メディアを始めとする皆様の役に立つ情報発信を行っていきます。
「mimi(R)︎」について
フェアリーデバイセズ株式会社及び共同研究先等の音声技術に関する研究成果の集大成であり、機械の「耳」を実現するための音声AIサービス・製品群です。「mimi(R)︎」は、世界最高水準のエッジ音声AI、多言語音声認識・翻訳や音声感情認識、話者識別等を実現するクラウド音声AI、従来は音声認識が困難だった場面にも適用可能なユニークな専用ハードウェア・開発キットからなり、特に多言語対応と高騒音環境での音声認識性能に強みを持ちます。「mimi(R)︎」が提供するサービス・製品を最適に組み合わせることで、高い性能を持つ音声ユーザーインターフェースを様々な現場で構築することができます。
フェアリーデバイセズ株式会社について URL: https://www.fairydevices.jp/
フェアリーデバイセズ株式会社は、「使う人の心を温かくする一助となる技術開発」を目指し、VUI※a・VPA※b関連技術や音声認識/音声翻訳関連技術とクラウド基盤、それらの性能を活かすエッジデバイスの開発を通して、音声技術を中心とした機械学習技術の実業務現場への適用を推進して参りました。さらに、現場の人から生まれる各種のデータ解析や、それらに関わる最先端の応用研究を実装した業務ソリューションを、デバイスからクラウドまで一気通貫で提供することによって、様々な業界のデジタルトランスフォーメーションを支援しています。
※a VUI:Voice User Interface / ※b VPA:Voice Personal Assistant
※本プレスリリースに記載されている会社名、製品名は各社の登録商標または商標です。