文書のようには見つけられない画像や動画
本連載の第10回において、「サーチは非定型データ(コンテンツ)を仮想的に統合するための手段である」と述べた。物理的に情報を集約しなくとも、サーチが関連する情報を一貫性のある形でユーザーに提示してくれるということである。
このような仮想統合は、現時点においても、文書コンテンツ(例えば、HTML、Word、PDF)については充分な効果を発揮してくれる。
では、音声、イメージ、動画などのいわゆるマルチメディアコンテンツについてはどうなのだろうか? 企業内においてもこれらのマルチメディアデータを効率的に管理する必要性が増している。
しかし、残念ながら現時点では充分な機能が提供されているとは言い難い状況だ。
例えば、インターネットのサーチエンジンにおいても画像や動画のサーチを行なうことはできるが、これは画像や動画のコンテンツ(内容)そのものをサーチしているわけではない。画像や動画に付随したメタデータ(例えば、JPEG型式の画像であればExifなど)や、ウェブコンテンツ上でその画像や動画の近辺にあるテキスト情報をサーチしているにすぎない。
実際、インターネットのサーチエンジンで画像検索を行なっても、あまり関係のない画像が表示されることは多いだろう。
人の顔に絞って検索できるGoogleの画像検索
マルチメディアデータについても文書データと同様にその内容にまで踏み込んだサーチを行なう必要性が増している。技術的には容易な課題とは言えないが、すでにいくつかの実験的な試みがある。
例えば、Googleの画像検索においても、パラメータとして&imgtype=faceを指定することで顔の画像だけを表示できる裏技があることが知られている。
限定的ではあるが、グーグルは画像の内容そのものに踏み込んだサーチを行なっているということだ。もちろん、本当に知りたい人の顔が表示されるかどうかは別として、少なくとも顔ではないと判断された画像を結果リストから外すことができる。パターン認識のテクノロジーとしては基本的なものだが、それでも有用性は充分にあるだろう。
画像の類似性をショッピングに活かしたlike.com
より、興味深い事例としては、画像処理技術のベンチャー企業であるRiyaが実験的に公開している「like.com」というサイトがある。
画像のマルチメディアサーチをショッピングサイトに応用した例だ。例えば、「この写真のモデルが持っている商品に似た商品を探せ」などの検索を行なうことができる。類似の判定における色、形状、パターンの重み付けをリアルタイムで調節したり、特定の指定をすることもでき、「形は似ていて別の色の商品を探せ」というような要求にも応えることができる。
ほかにも著作権侵害コンテンツや児童ポルノなどの違法コンテンツの検索など、画像や動画の内容にまで踏み込んだマルチメディアサーチのテクノロジーの応用分野は無数にあるだろう。
この連載の記事
-
最終回
トピックス
エンタープライズサーチの真の価値を探る(9)――多様な領域に広がるサーチの可能性 -
第18回
トピックス
エンタープライズサーチの真の価値を探る(8)――「意図のデータベース」 -
第17回
トピックス
エンタープライズサーチの真の価値を探る(7)――バーチカルサーチの可能性 -
第15回
トピックス
エンタープライズサーチの真の価値を探る(5)――サーチとBIとのもうひとつの関係 -
第14回
トピックス
エンタープライズサーチの真の価値を探る(4)――結構親密なサーチとBIの関係 -
第13回
トピックス
エンタープライズサーチの真の価値を探る(3)――柔軟性が求められるランキングアルゴリズムの実装 -
第12回
トピックス
エンタープライズサーチの真の価値を探る(2)――ポータルとしてのサーチ -
第11回
トピックス
エンタープライズサーチの真の価値を探る(1) -
第10回
トピックス
いまあえてWeb 2.0を分析する(10)――企業内Web 2.0と切っても切れないエンタープライズサーチ -
第9回
トピックス
いまあえてWeb 2.0を分析する(9)――Web 2.0系テクノロジーはどこが優れているのか? - この連載の一覧へ