このページの本文へ

前へ 1 2 3 次へ

映像制作の核になる「Adobe Premiere Pro CS4」

2009年02月16日 19時00分更新

文● 斎賀和彦

  • この記事をはてなブックマークに追加
  • 本文印刷

会話の内容でシーンを抽出画期的なメタデータ機能

 話し手ごとに解析し、分割してメタデータ化することもできる「スピーチ検索」機能は、「高」(低速)、「中」(高速)の2種類から品質を選択できる。

 注目すべきは対応言語数だ。英語、スペイン語、フランス語、ドイツ語、イタリア語、韓国語、日本語──の7カ国語に対応し、英語、スペイン語、フランス語に関しては方言もサポートしている。

スピーチ検索

書き起こしのメニューでは、品質のほか、言語/話し手別に解析するかを選択できる。現時点での精度はそれほど高くなく、時間が許すなら品質は「高」を選ぼう

スピーチ検索

7カ国語の言語に対応するほか、英語はオーストラリアやカナダ、スペイン語はラテンアメリカ、フランス語はカナダ──などの方言にも対応。アジアから英語圏まで幅広くカバーしている

 解析が終了すると、メタデータウィンドウ内に結果が表示される。解析には相当な時間が必要で、前述のMac Proでは速くても実時間の数倍、遅い場合は20倍以上の時間を要した。書き起こしはバッチ処理が可能なので、素材が複数ある場合はある程度まとめて実行したほうがいいだろう。

書き起こされたテキスト

書き起こされたテキストデータは、タイムコードとひも付けされ映像と同期する。非常に高度な技術だが、現状では子どもの歌や屋外での会話に関しては使いものにならない

 解析結果のテキストをクリックすると、ビデオが連動して頭出しされる。ビデオを再生した場合はシーンに合わせて文字がハイライトされていく。検索した場合は、一致する複数のテキストがハイライト表示され、これらをクリックしてシーンにアクセスする。現在の映像検索の主流は早送りと巻き戻しの延長でしかないスクラブ再生であるため、これは革新的な進化といえる。

 解析したテキストはコピーできるので、テロップやインタビュー起こしなどに流用することも可能だ。ただし、言語に限らず解析精度はいまひとつで、過度な期待はできない。現状ではシーンをざっくり検出するための検索ツールとして使用するのが無難だろう。


「スピーチ検索」の解析例

英語原文 Satoshi Yasui is the kind of designer who can riff on any product--including socks. Not just any socks
結果 Citgo she is to reduce the kind of designer who came to refund any crime including socks not just any stocks
日本語原文 三十間長屋は、金沢城の倉庫として、江戸時代初期に建設されたもので、国の重要文化財に指定されています。
結果 ウコン 上地 喜ぶ 会 は 午後 十 時 十 五 歳 で 江戸 時代 初期 に 建設 さ れ た もの で 国 の 重要 文化財 に 指定 さ れ て い ます

【Conclusion】
○ CS4ファミリー間でレンダリングを挟まずにデータを連携できるため、生産性が大幅に向上。メタデータによる素材の管理機能の強化にも注目。
× 進化したぶんより強力なマシンパワーが必要になった。生産性は向上したが、ひとつひとつの編集機能には使い勝手の面で改善の余地がある。



筆者紹介──斎賀和彦


 1963年名古屋生まれ、東京都在住。東京ムービー新社で劇場映画「AKIRA」参加後、CF制作会社・井出プロダクションで企画演出として多くのコマーシャルフィルムに携わる中でノンリニア映像編集の黎明期に立ち会う形となる。デジタルスケープ・チーフトレーナーを経ていくつかの大学、大学院で理論と実践の両面から映像を教える。並行して写真・映像等の企画・制作を行なうほか、デジタル編集を中心にビデオ専門誌等に執筆。自身のブログはこちら


前へ 1 2 3 次へ

カテゴリートップへ

ASCII.jp RSS2.0 配信中