日本電信電話(株)は25日、インターネットやモバイル環境でなめらかな動きの動画を再生するための画像圧縮方式として、MPEG-4超高圧縮映像符号化方式“VideoESPER”(Video Efficient SPrite-aided EncodeR)を開発したと発表した。
これは、従来の“MC+DCT”(Motion Compensated coding + Discreet Cosign Transform)と呼ばれる、動き補償フレーム間予測符号化(MC)と離散コサイン変換(DCT)を結合したハイブリッド方式(ノーマルモード)と、複数の動画像フレームの背景から“スプライト”と呼ばれる1枚の静止画像(パノラマ画像)を作成し、移動する物体(前景オブジェクト)と分けて圧縮を行なう方式(スプライトモード)を組み合わせて高圧縮を行なう方式。MC+DCTでは、低ビットレートの場合、高速で動く被写体を追尾したり、ズームやパン、チルトなどのカメラの操作が行なわれたりすると、十分なフレームレートや画質が保ていないが、一方でそのような映像に適したスプライトモードは、スプライトの作成を手動あるいは半自動で行なわなければならないという問題があった。
今回開発したVideoESPER方式では、背景と前景を分離するために“簡易ビデオオブジェクトモデル”を採用。カメラの動きを反映する領域を背景とし、それ以外の動物体すべてを1つの前景として自動的に分離することで、フレームにまたがる複数のビデオオブジェクトの対応問題を回避できたという。スプライトモードに適した映像では、従来の半分から4分の1の符号量で、同程度の画質・フレームレートを確保できるという。対象となる映像の符号化モード判定の自動化は、(1)ショットにおけるフレームの数、(2)カメラモーションの有無、(3)前景率算出の順に調べることで行なわれるが、カメラモーションの算出と前景率の算出にはビデオオブジェクトの自動生成の技術を利用しているという。
同社では、今後、エンコーダー(符号化装置)の高速化や機能向上と同時に、音声の多重化に対応し、ストリーミング配信のキープロダクトとして展開を図るとしている。なお、デモンストレーション映像とデコーダーはホームページからダウンロードできる。