このページの本文へ

リアルタイム通信の音声・ビデオをクラウドサービスで容易に活用

WebRTCの敷居を下げるSkyWay、クラウド連携サービスを追加

2019年01月24日 14時00分更新

文● 大谷イビサ/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 2019年1月23日、NTTコミュニケーションズはWebRTCでの音声・ビデオデータをクラウドサービスと容易に連携できる「Media Pipeline Factory」の提供を開始した。1月21日に行なわれた事前説明会ではWebRTCとSkyWayの技術概要、Media Pipeline Factoryのメリットなどが披露された。

標準技術で「Skype」を実現するWebRTCとSkyWay

 NTTコミュニケーションズのMedia Pipeline Factoryは、同社が開発したリアルタイム通信用の基盤サービスである「Enterprise Cloud WebRTC Platform SkyWay」(以下、SkyWay)用の機能拡張キットになる。SkyWayで取得された音声や映像データをさまざまなクラウドサービスと連携することが可能になる。

 SkyWayはこのWebRTC音声やビデオ通話などのRTC(Real Time Communication)をWebRTCプラットフォーム。事前説明会で発表したNTTコミュニケーションズの大津谷亮佑氏は、「Skypeとできることはいっしょだが、アプリのインストールやアカウントも不要で、匿名での利用も可能。アプリやサイトに埋め込むことができる」というWebRTCのメリットについて説明した。

NTTコミュニケーションズ 技術開発部 Webコアテクニカルユニットリーダ/担当課長 大津谷亮裕氏

 WebRTCはサーバーを介さないいわゆるP2P(Peer to Peer)でのリアルタイム通信を実現すべく、HTML5の仕様の一部として標準化されている。しかし、これらWebRTCを本格的に実現しようとすると、RTPのようなリアルタイムネットワークプロトコル、暗号通信、コーデック、API、NAT超え、メディアサーバーなどさまざまな技術を自前で実装する必要がある。こうした「総合格闘技」にあたるWebRTCをプラットフォームとして提供するのがSkyWay。SkyWayのSDKを用いれば、WebサイトやiOS/Androidに通話機能を簡単に埋め込むことができる。

 シリコンバレーで開発され、2013年12月に無料トライアルとしてスタートしたSkyWayだが、2017年9月に商用サービスに移行。国内での開発者の数は5000ユーザーを突破し、アプリの数も5200を超えた。オンライン英会話最大手のレアジョブがSkypeからの前提に採用を発表しているほか、オンライン診療サービス「CLINICS」などでも導入されているという。

クラウドとの連携により、音声認識や機械翻訳、VoIP通話も容易に

 従来、SkyWayにはWebブラウザ、iOS/Android以外の端末しか利用できなかったが、昨年の6月に組み込み機器や家電、IoTデバイスなどでの利用を前提としたWebRTC Gatewayを投入した。そして、今回発表されたMedia Pipeline Factoryにより、クラウドサービスとの連携が可能になり、クラウドにビデオや音声を送信したり、AIサービスを利用できるようになった。

Media Pipeline Factoryでクラウドサービスとの連携を実現

 Media Pipeline Factoryが連携可能なクラウドサービスは、日本語での対話が可能なNTTコミュニケーションズのAIエンジン「COTOHA Virtual Asssistant」やGoogle Cloud PlatformのSpeech API、Translation APIなど。GUI上でコンポーネントを並び替えることで、シンプルな処理であればプログラミングなしに実装できるという。サービス自体もマイクロサービスアーキテクチャを採用されており、大量アクセスなどでも安定したサービス提供を可能にするという。

 ユースケースも豊富で、AIサービスと組み合わせることで音声認識や機械翻訳、画像認識を実現したり、Amazon S3のような外部ストレージに録音・録画データを保存できる。また、SIPサーバーの連携でVoIP通話を行なったり、WiFiとCDNとの組み合わせで低遅延のライブを配信することも可能だ。

 Media Pipeline Factoryは2019年1月23日より無料でのトライアルが提供され、録音、音声認識、機械翻訳など6種類のビルトインコンポーネントが用意される。SkyWayを導入しているレアジョブとはオンライン英会話サービスにおいて、発話単語やユニーク単語などを分析することで習熟度を可視化する実証実験を共同で実施する。

■関連サイト

カテゴリートップへ

本記事はアフィリエイトプログラムによる収益を得ている場合があります

アクセスランキング

  1. 1位

    TECH

    訓練だとわかっていても「緊張で脇汗をかいた」 LINEヤフー、初のランサムウェア訓練からの学び

  2. 2位

    ITトピック

    若手が言わない“本音の退職理由”上位は/「データ停止は景気後退よりも企業の脅威」6割/クライアントに告げずAI活用するフリーランス、ほか

  3. 3位

    ビジネス・開発

    最悪のシナリオは「フィジカルAI」による基幹産業の衰退 日本の勝ち筋は、“同期技術”と“ドメイン知識”

  4. 4位

    Team Leaders

    ファイル名が命名規則に合っているかの自動チェック、Power Automateのフローで実現しよう

  5. 5位

    TECH

    “GPUなし”ノートPCで動くLLMで、ローカルAIエージェントを自作する

  6. 6位

    TECH

    糖尿病超早期を採血なしで検出、予防へ! 代謝や臓器のつながりに着目した予防法開発

  7. 7位

    ビジネス

    廃校がAIの心臓部に!? 地方の遊休施設を「AIデータセンター」に生まれ変わらせるハイレゾの挑戦がアツいぞ

  8. 8位

    データセンター

    液冷技術の最先端が集うイノベーションラボ「DRIL」、印西のデータセンターに現わる

  9. 9位

    TECH

    業界横断で“サイバー攻撃から供給網を死守” NTT・アサヒ・トライアルらが「流通ISAC」始動

  10. 10位

    Team Leaders

    バックオフィス業務もAIに“丸投げ” マネーフォワードが「Cowork」機能を2026年7月に投入へ

集計期間:
2026年04月08日~2026年04月14日
  • 角川アスキー総合研究所