フジテレビジョン(フジテレビ)は3月29日、同社が運営する動画投稿サイト「DEAM FACTORY(ドリファク)」の基盤として、Microsoft Azureの動画配信サービス「Media Services」を採用したことを発表した。Media Servicesに実装されたMedia Analyticsの機能を使って、映像に多言語の字幕を自動追加するサービスを7月1日から提供する。
ドリファクは、視聴者が撮影した動画を投稿するYouTubeのようなサイト。「ピコ太郎のように世界で活躍するパフォーマーやアーティスト、クリエイターをプロデュースしたい」(フジテレビジョン 常務取締役 大多亮氏)という思いで、同社が1月16日に立ち上げた。「バンド」「漫才」「ショートムービー」「CG」などジャンルごとに135のコミュニティが用意されており、それぞれのコミュニティで再生数ランキングや「LOVE(いいね)」数ランキングが表示される。同日発表されたように、同サイトの基盤にはMedia Servicesが使われている。
Media Servicesには、ビデオ音声の自動テキスト化(Indexer)、ビデオ内で移動する人の顔を検出して追跡する機能(Face detection、Face emotion detection)、ビデオの内容をサマライズする機能(Video summarization)、規制対象コンテンツの検出機能(Content moderation)など、マイクロソフトのAIサービスAPI群「Cognitive Services」のうち動画に関連するAPI群をまとめた「Media Analytics」が実装されている。
今回、フジテレビと日本マイクロソフトは、Media AnalyticsのIndexer機能などを使って、ドリファクの動画の音声をテキスト化・機械翻訳し、動画に多言語の字幕を自動追加する機能をドリファクに実装。7月1日から、英語・中国語・スペイン語・フランス語での提供を開始する。対応言語は順次拡大する予定で、最大9カ国語に自動翻訳することを目指す。「投稿動画を多言語翻訳して配信することで、アーティストやクリエイターの世界進出を支援したい」(大多氏)。
Media Analyticsでは、自動字幕作成だけでなく、動画に登場する人物の顔を検出・追跡して登場時間を集計したり、映像にうつり込んだ人物の顔に自動で“ぼかし”をいれたりといったことが可能だ。大多氏は、これらのAI機能について、「タレントのギャラを決めるために、テレビの露出時間をストップウォッチで測っているケースがある。映像の世界で、これまで手でやっていた作業がAIで自動化できる」と期待を寄せた。今後、字幕作成以外の分野でもMicrosoftのAIを取り入れていくという。
AIのトレーニングデータとして映像コンテンツを提供
フジテレビは、これまでもCS放送「フジテレビONE TWO NEXT」の動画配信基盤としてAzureのMedia Servicesを利用していた。大多氏によれば、ドリファクの立ち上げに際してONE TWO NEXTのチームから発案があり、ドリファクの基盤としてAzureの採用に至ったということだ。
また今回、フジテレビと日本マイクロソフトは、AzureのAI機能の日本語認識率向上に向けて協力する。ドリファクから提供を受けた映像コンテンツをAIのトレーニングデータや研究材料として活用し、日本語の認識率、顔認知技術の肖像権チェック、映像モデレート技術による成人向けコンテンツの自動排除処理、自動翻訳、索引付けなどの機能向上につなげていく。
日本マイクロソフトによれば、今回のように企業間での契約がない限り、Cognitive Servicesで分析した映像データをトレーニングデータに利用することはしないという。