このページの本文へ

日立、次世代画像検索技術を開発――仮想3次元空間上に1000枚単位の類似画像群を表示、自由な視点移動で閲覧可能

2000年05月29日 00時00分更新

文● 編集部 小林伸也

  • この記事をはてなブックマークに追加
  • 本文印刷

(株)日立製作所は29日、仮想3次元空間を利用して類似画像を検索する新技術を開発したと発表した。あらかじめ多数の画像1枚1枚の色空間分布や濃淡、解像度などの各種情報を読取っておき、検索元の画像と類似した画像をピックアップ、抽出した画像をサムネイル化して1000枚単位で仮想3次元空間に配置する。ユーザーは画像が配置された空間をマウスで自由に視点移動し、目標の画像を探し当てるというもの。大量のデータの直感的な把握を可能にすることを目指した技術で、同社では映像アーカイブや放送局といった映像のプロ向けにとどまらず、コンシューマーのビデオ編集など幅広い用途への応用を目指す。

日立が開発した次世代画像検索技術の画面
日立が開発した次世代画像検索技術の画面



新技術では、検索時間短縮のために多数の画像の特徴をあらかじめ数値化しておく必要がある。数値化は主に(1)色特徴量、(2)微分特徴量の2成分を検出することで行なう。色特徴量では、ある画像を構成する各画素のRGB値を色空間座標に配置して3次元的なヒストグラムを作成し、画像の色分布を数値化しておく。微分特徴量では、画像をグレースケールに変換し、濃淡の明るさ変化のベクトルを検出し、被写体の形状やテクスチャー情報を抽出する。この2つの特徴量情報に加え、分割した画像を分析して得た構図の情報と、画像の解像度情報を加味し、ある画像の“特徴量ベクトル”を算出する。

画像検索の際には、探し出したい画像に類似した画像を検索元の画像として利用する。検索エンジンは、提示された検索元の画像を同様の方法で分析し、検索元の画像と似た特徴量ベクトルを持つ画像を1000枚単位でピックアップ。仮想の3次元空間にピックアップした画像のサムネイルを検索結果として出力する。3次元空間への配置は、特徴量ベクトルの類似度の勾配に従って球心から配置場所を決めていくため、画像集団はさながら“球状星団”のような球型となる。また画像集団内における各画像間の距離の遠近は、画像の類似度の高低を表すことになるという。

仮想空間内で画像を探し当てるには、空間上を自由に動き回れる“カメ”と“カニ”のオブジェクトを使う。カメはxyzの3軸と自分を中心とした回転運動が可能。カニはカメを中心とした公転運動を行ない、カメと一定の距離を保ちながらカメに追随する。ユーザーはこの2つを駆使することで仮想空間内で視点を変更し、目的の画像を検索する。

カメ(左上端の右ウインドー)とカニ(左上端の下のウインドー)をマウスで操作して仮想3D空間を飛び回る。日立本社で開かれた記者発表会では、Linux上で動作するシステムが公開された。クライアントマシンのグラフィックスアクセラレーターは米NVIDIA社の『GeFORCE 256』を使用している。「開発途中の2年前はハイエンドのワークステーションが必要だった」という
カメ(左上端の右ウインドー)とカニ(左上端の下のウインドー)をマウスで操作して仮想3D空間を飛び回る。日立本社で開かれた記者発表会では、Linux上で動作するシステムが公開された。クライアントマシンのグラフィックスアクセラレーターは米NVIDIA社の『GeFORCE 256』を使用している。「開発途中の2年前はハイエンドのワークステーションが必要だった」という



これはカニから見たカメ
これはカニから見たカメ



システムは、特徴量データベースと検索用サーバー、検索結果を表示するクライアントで構成される。特徴量データベースと検索サーバーは現在の一般的なスペックを持つパソコンで数十万件の画像を扱えるという。仮想空間の表示はクライアント側の表示能力に依存し、OpenGLに対応した3Dグラフィックスアクセラレーターと大容量のVRAMが必要になる。VRAMが32MBの場合で1000枚のサムネイルが表示可能という。

新技術は、通産省の“リアルワールドコンピューティングプロジェクト”の一環として開発された。同プロジェクトを委託された“技術研究組合 新情報処理開発機構(国内主要メーカーらで構成する共同研究機関)”に日立の中央研究所が参加、大量の画像情報を視覚的に検索する技術の開発をテーマに取り組んできた。

同社によると新技術の狙いは、可能な限り大量のデータを閲覧できるインターフェースの開発にあるという。コンピューターの高性能化でデータ量は増大し続ける一方、数十万枚の画像から目当ての画像を探し出すような検索技術はまだ確立していない。新技術では(1)特徴量ベクトルによる高速画像検索、(2)検索結果を表示する3次元可視化技術、(3)カニとカメによる視点移動――の3要素により、大量の画像を一度に見渡せる検索技術を可能にした。特に3次元化が画像の一覧性を高めており、2次元空間では100枚程度が限界だという。

同社では応用として、大量の画像を高速に検索する必要がある画像配信サイトや、放送局におけるノンリニア編集時の素材検索などを考えており、検索サーバーなどシステムのライセンス販売なども考えている。同社は動画の各場面を抽出して静止画として表示するソフトを開発・販売しており、新技術と組み合わせたビデオ編集ソフトなどコンシューマー向けの展開も視野に入れている。「現在はLinux上で動作しているが、来年にもWindowsに移植した商用ソフトを発売できるのでは」(日立製作所中央研究所マルチメディアシステム研究部長の木下泰三氏)としている。

日立本社で開かれた記者発表会では、研究員が新技術のデモを行なった。仮想空間における視点の移動中はMIDIによる音楽も再生され、ゲーム感覚で画像を検索できる。異世界的な背景の3次元空間にサムネイルが浮遊する眺めはまさに次世代のインターフェース。画像だけにとどまらず、ドキュメントや音楽といった各種ファイルの検索や、『エクスプローラ』のようなファイル管理ソフトとしても使用できそうだ(例えばフォルダやアイコンが浮遊するとか)。今や持て余すほどパワーアップした最新パソコンだが、その使い道はまだまだ発展途上。マシンパワーがアップするとユーザーにどんなメリットがあるのか。新技術はその一つの答えと言えそうだ。

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン