このページの本文へ

前へ 1 2 次へ

栗原潔の“エンタープライズ・コンピューティング新世紀” 最終回

エンタープライズサーチの真の価値を探る(9)――多様な領域に広がるサーチの可能性

2008年02月19日 14時33分更新

文● 栗原潔

  • この記事をはてなブックマークに追加
  • 本文印刷

テキスト・マイニングへの応用


 膨大なデータの中から、コンピューターのアルゴリズムにより一定のパターンを見つけ出す処理を「データマイニング」と呼ぶように、膨大なテキストに対して同様の処理を行なうことを「テキストマイニング」と呼ぶ。サーチと「テキストマイニング」は類似性が強いテクノロジーである。例えば、グーグルが提供する「AdSense」などのコンテンツ連動型広告も、ウェブのコンテンツの中から最も関連性が強い広告キーワードを選び出すという点で、テキストマイニングの一種と呼ぶこともできるだろう。

 また、リアルタイム性が高いテキストマイニングのニーズも高まっている。例えば、インターネット上の膨大なテキスト情報を分析し、特定の製品や企業の「レピュテーション」(評価)がどうなっているかをリアルタイムで監視するソリューションも実現可能だ。証券のアルゴリズム取引(相場の状況に応じてシステムが発注処理をする取り引き)などへの応用も考えられるだろう。

 サーチエンジンのテクノロジーにより、企業内外のメールの内容を監視し、コンプライアンス上の問題がないかを監視するソリューションも有効だ。内部統制の一貫としてコンプライアンスが重要であるとは言え、人間が目視でメールを監視することは明らかにセキュリティー上、および、プライバシー上問題だ。サーチエンジンによる自動化を行なうことで真にリスクが高いメールにのみフォーカスすることができる。

 また、厳密にはテキストマイニングというよりも文字列マッチングに近い利用法だが、ニュース配信社で興味深いサーチエンジンの活用法を行なっている企業がある。ライセンス契約の下で配信したニュースが、ネット上で不当に利用されていないかをサーチエンジンのテクノロジーを使うことでリアルタイムで監視しているのである。



Webパーソナライゼーションへの応用


 サーチのテクノロジーはWebサイトや企業内ポータルのパーソナライゼーションにも活用できる。例えば、利用者の行動パターンやプロファイルに合わせて最も関連性が高いコンテンツを自動的に選択することができる。上記のテキストマイニングがコンテンツから重要な情報を抜き出す処理であるのに対して、サーチは特定の情報に最も関連性が高いコンテンツを選択する機能であると言える。このようなサーチエンジンのテクノロジーにより、自動的に選択表示されるコンテンツのことを「ポートレット」ならぬ「サーチレット」と呼ぶこともあるようだ。

 また、まったくの自動化ではなくても、ユーザーの嗜好や行動パターンをサーチエンジンが把握することにより、最小限の検索語の入力だけでユーザーが求める情報を得られるようにできる。特に、携帯電話などからサーチを行なう場合には、入力の最小化は魅力的な価値提案となるだろう。

最後に

 9回に分けて述べてきたように、サーチテクノロジーの価値は従来からある「情報検索」に留まるものではない。企業内において多様な価値を提供できる可能性を有している。別記事でも述べたように、マイクロソフトがFAST社を買収する可能性が高まっているが、これもサーチテクノロジーが有する本質的な価値の表れだ。企業ユーザーは今まで以上にサーチの可能性について注視していく必要がある。


筆者紹介-栗原潔

著者近影 - 栗原潔さん

(株)テックバイザージェイピー代表、弁理士。日本IBM、ガートナージャパンを経て2005年より独立。先進ITと知財を中心としたコンサルティング業務に従事している。東京大学工学部卒、米MIT計算機科学科修士課程修了。主な訳書に『ライフサイクル・イノベーション』(ジェフリー・ムーア著、翔泳社刊)がある。


前へ 1 2 次へ

カテゴリートップへ

この連載の記事

注目ニュース

ASCII倶楽部

プレミアムPC試用レポート

ピックアップ

ASCII.jp RSS2.0 配信中

ASCII.jpメール デジタルMac/iPodマガジン