このページの本文へ

リアルタイム通信の音声・ビデオをクラウドサービスで容易に活用

WebRTCの敷居を下げるSkyWay、クラウド連携サービスを追加

2019年01月24日 14時00分更新

文● 大谷イビサ/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 2019年1月23日、NTTコミュニケーションズはWebRTCでの音声・ビデオデータをクラウドサービスと容易に連携できる「Media Pipeline Factory」の提供を開始した。1月21日に行なわれた事前説明会ではWebRTCとSkyWayの技術概要、Media Pipeline Factoryのメリットなどが披露された。

標準技術で「Skype」を実現するWebRTCとSkyWay

 NTTコミュニケーションズのMedia Pipeline Factoryは、同社が開発したリアルタイム通信用の基盤サービスである「Enterprise Cloud WebRTC Platform SkyWay」(以下、SkyWay)用の機能拡張キットになる。SkyWayで取得された音声や映像データをさまざまなクラウドサービスと連携することが可能になる。

 SkyWayはこのWebRTC音声やビデオ通話などのRTC(Real Time Communication)をWebRTCプラットフォーム。事前説明会で発表したNTTコミュニケーションズの大津谷亮佑氏は、「Skypeとできることはいっしょだが、アプリのインストールやアカウントも不要で、匿名での利用も可能。アプリやサイトに埋め込むことができる」というWebRTCのメリットについて説明した。

NTTコミュニケーションズ 技術開発部 Webコアテクニカルユニットリーダ/担当課長 大津谷亮裕氏

 WebRTCはサーバーを介さないいわゆるP2P(Peer to Peer)でのリアルタイム通信を実現すべく、HTML5の仕様の一部として標準化されている。しかし、これらWebRTCを本格的に実現しようとすると、RTPのようなリアルタイムネットワークプロトコル、暗号通信、コーデック、API、NAT超え、メディアサーバーなどさまざまな技術を自前で実装する必要がある。こうした「総合格闘技」にあたるWebRTCをプラットフォームとして提供するのがSkyWay。SkyWayのSDKを用いれば、WebサイトやiOS/Androidに通話機能を簡単に埋め込むことができる。

 シリコンバレーで開発され、2013年12月に無料トライアルとしてスタートしたSkyWayだが、2017年9月に商用サービスに移行。国内での開発者の数は5000ユーザーを突破し、アプリの数も5200を超えた。オンライン英会話最大手のレアジョブがSkypeからの前提に採用を発表しているほか、オンライン診療サービス「CLINICS」などでも導入されているという。

クラウドとの連携により、音声認識や機械翻訳、VoIP通話も容易に

 従来、SkyWayにはWebブラウザ、iOS/Android以外の端末しか利用できなかったが、昨年の6月に組み込み機器や家電、IoTデバイスなどでの利用を前提としたWebRTC Gatewayを投入した。そして、今回発表されたMedia Pipeline Factoryにより、クラウドサービスとの連携が可能になり、クラウドにビデオや音声を送信したり、AIサービスを利用できるようになった。

Media Pipeline Factoryでクラウドサービスとの連携を実現

 Media Pipeline Factoryが連携可能なクラウドサービスは、日本語での対話が可能なNTTコミュニケーションズのAIエンジン「COTOHA Virtual Asssistant」やGoogle Cloud PlatformのSpeech API、Translation APIなど。GUI上でコンポーネントを並び替えることで、シンプルな処理であればプログラミングなしに実装できるという。サービス自体もマイクロサービスアーキテクチャを採用されており、大量アクセスなどでも安定したサービス提供を可能にするという。

 ユースケースも豊富で、AIサービスと組み合わせることで音声認識や機械翻訳、画像認識を実現したり、Amazon S3のような外部ストレージに録音・録画データを保存できる。また、SIPサーバーの連携でVoIP通話を行なったり、WiFiとCDNとの組み合わせで低遅延のライブを配信することも可能だ。

 Media Pipeline Factoryは2019年1月23日より無料でのトライアルが提供され、録音、音声認識、機械翻訳など6種類のビルトインコンポーネントが用意される。SkyWayを導入しているレアジョブとはオンライン英会話サービスにおいて、発話単語やユニーク単語などを分析することで習熟度を可視化する実証実験を共同で実施する。

■関連サイト

カテゴリートップへ

アクセスランキング

  1. 1位

    ITトピック

    “VMwareショック”余波、IaaSベンダー撤退も/本音は「拒否したい」時間外の業務連絡/IT部門のデータメンテ疲れの声、ほか

  2. 2位

    データセンター

    首都圏のデータセンター枯渇、電力コストの高騰、エンジニア不足 課題から考える最新データセンター選び

  3. 3位

    デジタル

    なぜ大企業でkintoneの導入が増えているのか? DX推進と「脱・属人化」を実現するエンプラパートナーに聞いた

  4. 4位

    TECH

    【提言】「VPNの安全性」が通用しない時代 ZTNAへの困難な移行を経営層はサポートせよ

  5. 5位

    TECH

    自律的に動けないメンバーを持つくらいなら、一人で全部やったほうが幸せに働ける「管理職の憂鬱」に関する調査

  6. 6位

    データセンター

    「NVIDIA Blackwell GPU」約1100基搭載のAIインフラが稼働 さくらインターネットが石狩DC内で

  7. 7位

    ビジネス

    行政DXを超え、デジタルで市民の力を引き出す“地域社会DX”へ 兵庫県豊岡市の挑戦

  8. 8位

    デジタル

    kintoneの大企業売上は間もなく3割に サイボウズはグローバルで“戦える”新サービスも開発中

  9. 9位

    デジタル

    地方テレビ局が生成AIで記事作成を爆速に でもその裏で“10倍増えた”業務とは?

  10. 10位

    TECH

    IT人材の約半数が「静かな退職」 正当に評価されないし心身の健康を優先

集計期間:
2026年02月26日~2026年03月04日
  • 角川アスキー総合研究所