このページの本文へ

被災地支援で始まったプロジェクト

YouTube“自動字幕”で文字起こしはできる?

2011年07月15日 23時00分更新

文● 盛田諒/ASCII.jp編集部

  • この記事をはてなブックマークに追加
  • 本文印刷

 答えは「できる」。だが、まだテープ起こしの仕事はやめられそうにない。

 事情を説明しよう。14日、グーグルがYouTubeに「自動キャプション(字幕)」機能を追加した。2009年11月にリリースされていた英語機能の日本語版だ。通常どおりYouTubeに動画をアップロードするだけで、自動的に音声が認識され、数分で字幕データが付くというもの。字幕は動画の右下にある「CC」のボタンから「音声を文字に変換」を押すことで表示可能。ボタンが表示されないものは字幕が付かない。

字幕のフォントやサイズは「その他の設定」というメニューから変更できる。パソコンにインストールされている日本語フォントも選択可能。字幕の位置も自由にマウスで動かせるので、ニュースに元からついているキャプションなどとかぶる心配はない

 動画の投稿者は字幕をテキストとしてダウンロードできる。テキストを編集してデータを更新することも可能だ(投稿者以外が共同編集のような形で字幕を書き換えることはできない)。字幕データは「翻訳ボタン」から、50以上の言語に自動で翻訳できる。

 その精度が現段階でもなかなか高い。ひょっとしてこれは無料のテープ起こしに使えるのではないか? そんな退屈なライフハックを考えた記者が試した結果は以下の通り。

記者会見・ニュース:○

 ほぼ完璧に大丈夫で、精度も驚異的。ニュースではBGMがないものが多いため精度が高く、誤変換もキーボードの打ち間違いくらいのレベルが多い。TBSチャンネルなど、原稿データを字幕として読み込ませているチャンネルもある。もちろん精度は完璧だ。天気予報も基本的には大丈夫だが、派手なBGMが入ると精度が途端に低くなる。キャスターのにこやかな表情と裏腹に完全に間違った字幕が入るとかなり笑える。

一人語り系動画・インターネットアニメ:△

 ガジェットレビューなど、冷静な解説系動画はBGMがなければ基本的に大丈夫。アニメはBGMがないものでは、変換可能なものもあった。だが、あくまで“変換できる”というレベル。人気作「Peeping Life」では「すっごい素敵でしょう」というセリフがなぜか「続いて優勝」と変換され、それはそれでジワジワ笑いが誘われた。お笑い番組は変換できても、ほとんど原形をとどめていなかった。

楽曲・カンファレンス:×

 歌声や大勢での会話など、聴きとりづらいものは完璧に読みとれず、変換できない。「日本語の曲にも自動で字幕が付いて……」というのはまだ難しそうだ。ただし字幕用のテキストは自分でもアップロードできるので、投稿者はそれを使えばオーケー。

 ご覧のとおり、残念ながら記者の仕事が減ることはまだまだなさそうだ。

YouTubeプロジェクトマネージャーのブラッド・エリス氏

 ともあれこの機能を開発するきっかけになったのは、東日本地震発生後、3月26日に南相馬市桜井市長がアップロードした動画。この動画には手動で英語字幕が入れられ、世界的に知られることになった。日本には、世界にもっと広く伝えられるべき動画がある。その意気込みからプロジェクトがスタートしたのだという。ちなみに音声認識には「Google音声検索」と同じアルゴリズムを使っている。

 字幕機能には言語間の壁という“ランゲージバリア”を取り払うというだけではなく、“聴覚の壁”を取り払う、事実上のバリアフリー的意味もある。さらに、YouTubeの検索結果にも字幕に書かれている内容が反映されるという二次的効果もある。プロジェクトを指揮するYouTubeプロダクトマネージャーのブラッド・エリス氏は、「できるだけ多くの方がYouTubeの動画を楽しんでもらえることを望んでいる」と語っていた。


カテゴリートップへ

ASCII.jpメール デジタルMac/iPodマガジン

ASCII.jp RSS2.0 配信中

ピックアップ

富士通パソコンFMVの直販サイト富士通 WEB MART