社会人サークルが余暇を使って24時間で作った本格システム
今すぐYouTuberデビュー、AIで自動動画編集する「撮るだけユーチューバー」がすごい
2018年02月19日 13時00分更新
いまや子供が将来就きたい仕事ランキングの上位に入るようになった「ユーチューバー」。YouTubeに動画コンテンツをアップロードし、動画再生によって得られる広告収入などでビジネスをするクリエイターのことです。ユーチューバーになるために特別な資格や学歴は必要ありませんが、人気ユーチューバーを目指すとなれば、パソコン上で動画編集ソフトを使いこなして、コンテンツを作りこむスキルが求められます。
有料・無料の様々な動画編集ソフトがありますが、初心者が扱うのは少し大変。そんな、動画編集は苦手、労なく今すぐユーチューバーデビューしたいという人の夢と希望を叶えるべく立ち上がったクリエイター集団が、AIで動画を自動編集するシステム「撮るだけユーチューバー」を開発してくれました。しかも、休日や就業時間後のすきま時間で、たった12時間で。
動画中のジェスチャー―を認識して台詞をテロップ表示
「撮るだけユーチューバー」は、撮影した動画に、自動でテロップや効果音、場面転換演出の編集を加えてくれるシステムです。自動編集した動画は以下のようになります。
音声認識AIで動画に映っている人が発した台詞を認識・テキスト化し、さらに画像認識AIで「上を指さすジェスチャー」や「下を指さすジェスチャー」を認識してそのタイミングの台詞を画面上・下にテロップ表示するという処理を自動で行っています。固有名詞を認識してテロップの文字を強調したり、2つ目のセリフの前に効果音をつけたりといった処理もすべて自動です。
このシステムは、ヤフーが2017年末に開催したハッカソン「Yahoo! JAPAN Hack Day 10th Anniv.」の作品として披露され、最優秀賞とHappyHacking賞(ニコニコ生放送視聴者のリアルタイム投票で決定する賞)をダブル受賞しました。
社会人サークルが24時間で開発
撮るだけユーチューバーを開発したのは、社会人サークル「つくるラボ」のメンバー。今回のヤフーのハッカソンが「24時間のあいだに、作品開発、プレゼン、デモ展示をする」というルールだったため、アイデア出しから24時間でシステムを完成させたそうです。AI APIを実装し、画像と音声の分析結果を動画編集に落とし込むという高度なシステムですが、コーディングなどの実開発時間はたった12時間だったといい、メンバーのエンジニアリングの高さがうかがえます。
つくるラボは、東芝グループ社員を中心に20人ほどのエンジニアが参加するサークルで(社外メンバーも在籍)、主に就業時間後や休日を利用して活動しています。メンバーには、ソフトウェアエンジニアやハードウェアエンジニア、Webデザイナー、インダストリアルデザイナーなど幅広く専門家がおり、様々なハッカソンで活躍しているとのこと。今回の撮るだけユーチューバーのようなクラウドシステムにとどまらず、これまでに物理ボタン端末「ダンナダッシュボタン」(ワンタッチで奥様が旦那様にお使いを頼めるボタン、紹介動画)などを開発しています。
東芝の音声認識AI「RECAIUS」へ移行中
つくるラボ代表の衣斐秀聽氏によれば、撮るだけユーチューバーは現在、正式なサービスリリースに向けて開発を継続しているそうです。「ハッカソンで披露したバージョンでは、音声認識AIにオープンソースのAPIを採用していましたが、製品化に向けて、より日本語の音声認識に優れている東芝のRECAIUSを採用する方向で開発を進めています」(衣斐氏)。
また、撮るだけユーチューバーは、(12時間で急ぎ開発したこともあり)まだフロントのUIを作っていません。「当初は、ライトユーザーが手軽に使えるように、編集機能を制限してスマホアプリで操作をするようなUIを作ろうと考えていました。しかし、システムを公開したところ、本格的なユーザーからも使いたいという要望があって。UIは、実際に使いたいというユーザーさんの意見を聞きながら共同開発していきたいと思っています」(衣斐氏)。
撮るだけユーチューバーがどのような形でリリースされるのか、今から使うのが楽しみですね。