(株)エヌ・ティ・ティ エックスは2日、“ロボット型ディレクトリ”検索エンジンを開発したと発表した。同社では、これは世界で初めてとしている。夏ごろをめどに、このエンジンを同社の検索サイト“goo”に実装する。
これまでの検索エンジンは、大きく分けて2つに分類される。人間がウェブサイトの情報を収集してカテゴライズする“ディレクトリー型”と、ロボット(コンピューター)が自動的に情報を収集する“ロボット型”の2種類だ。
ディレクトリー型の場合、人間がカテゴライズするため、分類する際にそれぞれのウェブサイトの重要度などを加味できる。ユーザーがトップページから目的のサイトへたどりやすい一方で、すでに膨大な数に達しているウェブサイトのすべてを網羅することは、ほぼ不可能になる。
ロボット型の場合、自動的にウェブサイトを巡回して、キーワードに沿った情報を収集する。網羅性という点ではディレクトリー型より有利だが、検索語句によっては検索結果が相当な数になり、目的のサイトへなかなかたどり着けない。
ロボットがカテゴリーを生成する
NTT-Xが今回開発した“ロボット型ディレクトリ”検索エンジンは、ロボットが情報を収集し、なおかつカテゴライズするというものだ。
具体的な手順は、
- ロボットがウェブサイトの情報を収集
- “自動ページ編纂技術”で、サイトとしてくくり直す
- 収集したウェブサイトを“重要キーワード抽出プログラム『indeXer(インデクサ)』”で解析
- “自動サイト分類技術”によってカテゴリー別に自動分類する
- カテゴリー自体を、ユーザーの利用動向を分析して自動生成する
- ユーザーのニーズの順にカテゴリーを配列する
- サイトの被リンク数や価値をもとにランキングし、ランキング順に表示する
となる
これらの技術・手順のうちのいくつかは、すでに実用化されているが、今回開発された中で最も重要なのは“ロボットがカテゴリーを生成する”という技術だ。
たとえば、“車”というカテゴリーが、さらに“セダン”や“ワゴン”など、車種によって細かく分類されているとする。だが、特定の車種に分類される情報量が多くなった場合、そのカテゴリーを“4ドア”と“5ドア”のように自動的に細分化する。また、これまでにはなかった新たな車種が現れた場合、カテゴリーを新たに生成するという。
もっとも、最終的なチェックは人間が行なう。NTT-Xでは、この技術によって、情報を幅広く網羅し、スピーディーに更新され、初心者でもわかりやすいカテゴライズがなされた検索サイトを構築できるとしている。
