説明会の後半は、フィリップスの研究機関であるフィリップスリサーチの上級研究員、ヤン・ネスヴァドバ氏(Jan Nesvadba)が、DVD/HDDビデオレコーダーの発展に伴うコンテンツ管理の必要性や、それに関する研究開発中のシステムの解説を行なった。
フィリップスリサーチ・上級研究員、ヤン・ネスヴァドバ氏 |
ネスヴァドバ氏は、ビデオレコーダーの周辺事情として、
- 映像、音声、通信、放送の分野は、いずれもさまざまな規格・形式が存在している
- 今後、HDDタイプ、リムーバブルメディアともにさらに大容量化が進み、ビデオレコーダーが記録・再生できる容量は今よりも多くなる
といった複雑な状況があるとしている。特に、映像と音声の規格・形式が多様化と記憶容量の増加を最大限に活用するには、メディアに記録したコンテンツの「スマートな管理」を実現することが必須と考えているという。
ネスヴァドバ氏は、記録するコンテンツの形式、記録メディアの大容量化などにより、コンテンツ管理の重要性はこれまで以上に高まるとしている。そのために必要となるのが“コンテンツ記述子”で、これをいかに手間をかけずにコンテンツに付けていくかをネスヴァドバ氏は研究している |
スマートな管理を実現するには、ビデオレコーダーやパソコン、そしてユーザーは、受信または録画しているコンテンツが何かを知る必要があり、これには“コンテンツ記述子(メタデータ)”を利用するとしている。ネスヴァドバ氏によると、コンテンツ記述子を各コンテンツに付加することにより、メディアに記録したコンテンツの管理や検索のしやすさは格段に向上するという。
このコンテンツ記述子を得る方法としては、インターネットや放送網などを利用してサービスプロバイダーから取得する方法と(代表的な例としてはEPGがある)、ローカルのコンテンツを分析してコンテンツ記述子を生成する方法とを挙げている。ネスヴァドバ氏が研究しているのは、後者のローカル・コンテンツの自動分析に関する内容で、
- ラジオ放送……たとえば、音楽が流れているパート、天気情報が放送されているパート、DJのトークのパートといったように放送内容を自動的に分類し、目録を生成
- 音楽コンテンツ(大量のMP3ファイルなど)……自動ジャンル分類、データベース化
- 映像コンテンツ……字幕などのテキストの抽出、映像シーンの解析(明るさ、音声、漫画アニメーションの判別、キーフレームの拾い出し)、映像中に登場する顔を認識して分類、といった機能を活用して記述子を生成
といった技術開発を行なっているという。この日の説明会では、実際にオーディオコンテンツのジャンル自動判別や映像コンテンツの分析といった機能のデモ映像が放映された。これらの機能は、前述した『Nexperia』シリーズ搭載のチップセットで実現するものとしており、ローカルで自動的に、そしてリアルタイムに分析・分類するという。
映像コンテンツの分析では、画面上の字幕の抽出や登場する人物の顔の認識により分類する | テレビ番組などでは、録画されているシーンの解析を行ない、録画内容のインデックス化を行なう | |
現在研究開発中のコンテンツ分析のデモ |
インターネットや放送網を利用したコンテンツ記述子に加え、ローカルでのコンテンツ分析がさらに進化していくことにより、AV機器のシステムはコンテンツの内容をより把握しやすくなり、AV機器の製造メーカーは、進歩したコンテンツ記述子を活用した新しい機能やアプリケーション、各個人向けのカスタマイズなどを施すことが可能になる。これによって、ユーザーはスマートなコンテンツ管理・検索のツールを、すべてのコンテンツに対して利用できるようになるという。
現在よりもさらに大容量化が進んだメディア内に大量のコンテンツを記録した場合や、さまざまな形式のファイルを蓄積し家庭内で共有する“ホームサーバー”などが進化していくには、コンテンツの管理や検索は必須の機能といえる。具体的な製品化時期などは語られなかったものの、今後の成果に期待したい。