このページの本文へ

コンピュータが得意な「行」と「列」のデータはもはや15%

非構造化データもOK!HPのIDOLはあらゆるデータを解析

2011年12月16日 09時00分更新

文● 大谷イビサ/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

12月15日、日本ヒューレット・パッカード(HP)は買収したオートノミー(Autonomy)とバーティカ(Vertica)の製品をベースにしたビッグデータ向けプラットフォーム「IDOL 10(Intelligent Data Operating Layer)」を発表した。11月にグローバルで発表された内容を受けたもので、非構造化データと構造化データの解析を統合する製品群となる。

非構造化データの活用に大きな課題

 HPはビッグデータ向けのソリューションとして、今までスケールアウト系のストレージやHadoopに最適化されたインフラの構築支援サービスを提供してきたが、今回は同社が買収したオートノミーとバーティカの製品をプラットフォームとして統合する。説明会において、HPのインフォメーションマネージメント事業部 事業部門 東アジア担当の春木菊則氏は、まず企業の情報活用の課題について説明した。

HP インフォメーションマネージメント事業部 事業部門 東アジア担当 春木菊則氏

 春木氏は「多くの企業は膨大な情報を溜め込んでいるが、活用できていない。瞬時に情報を見られない、探せない」と指摘。そして、この理由として、コンピュータに苦手な非構造化データの割合が高いからと説明した。「今までコンピュータはリレーショナルDBのような構造化されたデータを扱うのは得意だったが、これらは実は15パーセントしかない。残りはメールやTwitter、電話、ビデオなどの非構造化データ。これらは人間にとっては理解しやすいが、コンピュータには理解しにくい」(春木氏)。同社が「ヒューマンインフォメーション」と呼ぶこうした非構造化データに加え、既存の構造化データの分析を単一のプラットフォームで提供しようというのが、今回発表したIDOL 10の狙いだという。

ヒューマンインフォメーション時代とエクストリームデータ

 次にオートノミー 代表取締役 熊代悟氏が会社概要やIDOL 10の詳細について説明した。オートノミーは1996年にイギリスで設立されたソフトウェアベンダーで、非構造化データの解析に強みを持つ。2011年10月にHPによる買収が完了し、HPカンパニーとして事業を進めているという。

オートノミー代表取締役 熊代悟氏

 熊代氏は、「ITのうちのT(Technology)は進化してきたが、I(Information)は変わってない。昔からコンピュータの処理は行と列でデータを解釈していた」と説明。今までは非構造化データの領域が手つかずの状況だったが、「キーワードにタグ付けをしたり、分類のための定義を行なうアプローチでは限界が出てきた」(熊代氏)という。これに対して、オートノミーでは 統計的なアルゴリズムを用いた独自のパターンマッチングにより、データの意味を捉え、それぞれの関連性を分析。500以上の機能で、意味のある情報として提供するという。最大の特徴は、さまざまなアプリケーションのデータを自在に取り込める点で、「既存のお客さんのデータを取得できる400種類以上のコネクタを持っている」(熊代氏)という。

非構造化データは従来の情報とどこが違うのか?

リアルタイムに構造化・非構造化データを解析するAutonomy IDOL 10

 IDOL 10はこのオートノミーをベースに、構造化データを高速化処理するバーティカの製品を統合したプラットフォーム。名前の通り、レイヤーとして実装されるので、外部アプリケーションへ手を加える必要がない。これにより、非構造化データと構造化データを串刺しで検索できるという。また、セキュリティ面でも配慮されており、ユーザーやグループのアクセス権限に応じてデータを取得できるという。

 また、このIDOLをベースにアーカイブ、Eディスカバリ、エンタープライズサーチを実現する「HP Autonomy Appliance」も発表された。製品の出荷や価格などは未定となっている。

3種類の特定用途をサポートする「HP Autonomy Appliance」

カテゴリートップへ