このページの本文へ

松下電器、インターネット検索などを高速かつ正確に行なえる新方式を開発

1998年07月10日 00時00分更新

  • この記事をはてなブックマークに追加
  • 本文印刷




 松下電器産業(株)は、全文検索の新方式“極大単語索引方式”を開発、9日に記者発表会を行なった。インターネットや各種データベースにおいて、高速で精度の高い全文検索が行なえるといい、8月には同方式を採用した文書検索システムも発売する。

 従来、全文検索の方式には、辞書に登録された単語を文書から切り出し、ユーザーの入力する検索キーワードと照合することで検索を可能にする“単語索引方式”や、任意の文字列で検索できる“N-gram方式”などがあった。しかし、「単語索引方式では複合語や未知の単語の検索ができない、N-gram方式では検索ノイズが多い」(同社マルチメディアシステム研究所)などの問題があった。

 今回発表された極大単語索引方式は、単語索引方式をベースにしているが、文書から切り出す単語に冗長性を持たせたのが特徴。「たとえば、“中小企業経営動向調査”という単語が文書中に含まれる場合、単語索引方式では“中小企業”と“経営動向調査”の2単語を切り出していたが、極大単語索引方式ではそれに加えて“企業経営”という部分的に重なり合った単語も切り出して検索対象に含める」(同)。このことによって、ユーザーが検索キーワードとして“中小企業経営”という単語を用いた場合でも、正確に検索できることになる。

 このように、検索できる文字列の幅が広がっただけでなく、単語の内部構造に関する知識を備えているため、不適切な単語の切り出しが減少するという(たとえば、“スキー”というキーワードで検索したとき、“ウイスキー”を含む文書は検索結果に含めない)。そのほか、関連キーワードを抽出することで、検索結果を重要と思われる順番に並べる機能も付加されている。

 同社が8月に出荷する検索システムは、同社ワークステーション『PanaStation SS-UE450』をベースとし、OS『Solaris2.6』上で、極大単語索引方式を搭載したアプリケーションを稼動させるという。8月から企業向けに販売し、価格は数百万円から。(報道局 浅野広明)

http://www.mei.co.jp/panasonic-j.html

カテゴリートップへ

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン