このページの本文へ

企業のメタ情報を新聞記事から自動抽出する技術、NRIが開発

2009年05月27日 09時00分更新

文● ビジネス・ソリューション編集部

  • この記事をはてなブックマークに追加
  • 本文印刷

 「燃料電池」を開発している企業、あるいは液晶テレビを販売している企業を知りたい。こういったニーズに対応するにはこれまで人手で整理・構造化する必要があった。野村総合研究所(NRI)は、企業の属性情報を、新聞記事などから自動的に生成するシステムを開発。26日に発表した。

テキストデータからの企業活動のメタデータを抽出

 NRIが開発した「情報抽出エンジン」では、新聞記事などのテキスト文書を意味解析し、 [主体企業]‐[活動]‐[目的語]の形式で自動抽出する(○○社、販売、液晶テレビなど)。同時に、商品や技術用語に関する概念辞書を作り、同義語や類義語、表記ゆれを吸収できる。特定のキーワードを含んだ検索結果だけでなく、関連したキーワードを含む概念としての検索が可能だという。

 例えば、以下のような検索が可能だ。

  • 「燃料電池」を「研究開発」している企業を検索する
  • 目的の企業と「業務提携」「資本提携」関係にある企業を検索する
  • 「エコカー」に関する企業動向を整理して表示する(「エコカー」の下位概 念の「燃料電池車」「ハイブリッド車」などに関する企業活動を時系列や活動種 類ごとに整理)

 企業情報以外の大量の情報がヒットするウェブ検索エンジン、企業名称/銘柄コード/業種などからの検索で、具体的な活動内容や扱う商品名を知ることが難しい情報提供会社の企業情報サービスの間を埋めるのに有効だという。

燃料電池を開発している企業を新聞記事から検索

特定の企業がどんな活動をしているかを検索した結果

 抽出したデータを他の企業データと組み合わせ、企業活動の可視化や業界動向分析、企業リスク管理などを示す、高次な加工分析アプリケーションへの応用も検討している。具体的な製品投入時期などに関しては示されていないが、NRIではこの技術を、企業内の情報整理や分析業務高度化のためのITソリューションとして展開していく予定だ。

カテゴリートップへ

アスキー・ビジネスセレクション

ASCII.jp ビジネスヘッドライン

ピックアップ