データベースに眠るデータを解析し、企業の意思決定に用いるデータウェアハウス。しかし、データ容量が増大してきたことで、既存の製品では性能面ですでに限界が来ているという。これを解消するのが、高速な処理を前提に開発されたデータウェアハウス専用機である。オラクルの市場参入で俄然盛り上がってきたこの市場の先駆者である日本ネティーザのダグラス・エッツェル氏に話を聞く。
眠るデータを価値ある「情報」に変える
データウェアハウスは、基幹データベースから取引データを抽出し、業務に活かすために保存したデータの集合体を指す。通常の業務データベースがビジネスの動きに合わせて逐一更新されていくのに対して、データウェアハウスは過去のデータを時系列でまとめて保管し、顧客の購買傾向を分析するのに用いる。
データウェアハウスを用いると、たとえば「寒い日にコーヒーを購入する30代男性がサンドイッチを合わせて購入する確率」など、複数の関連した要素から営業上有用な情報を洗い出すことができる。一般的にはデータの集合体自体をデータウェアハウス、分析するツールをデータマイニングやBI(Business Intelligence)ツールを呼ぶが、実際は製品として統合されていることも多い。
1990年代に登場したデータウェアハウスは、基幹データベースをビジネスにより積極的に活用するソリューションとしてもてはやされ、流通や小売などの業界で多く導入された。
テラバイト級データベースに対応できない既存の製品
しかし、昨今このデータウェアハウスが大きな課題にぶち当たっている。データ量の爆発的な増加だ。ご存じの通り、昨今は「情報爆発」という表現が使われるほど企業が抱えるデータ容量は増えており、テラバイト級のデータベースはすでに当たり前の存在となっている。また、分析対象となるデータの種類も単なる売上げデータだけではなく、各種のログ、顧客の行動履歴など多岐に渡る。分析も、もはや特定の情報を探し出すというものではなく、素のデータから傾向やパターンを分析するといった高度な処理が必要だ。こうしたニーズに既存のデータウェアハウスはすでに対応できなくなっている。リクエストを出しても、結果がなかなか戻って来ないため、事実上システム利用の制限となり、「システムが死んでしまっている」というのだ。
もちろん、大容量化にともないコストも途方もない価格になる。「サンのサーバ、オラクルのデータベース、そしてEMCのストレージといった組み合わせで、大容量のデータウェアハウスを構築しようとすると、多大なコストがかかります」(ダグラス氏)という状況だ。
これに対して、「アプライアンス化」という手法で、高速なパフォーマンスを実現したのが、ネティーザである。同社は2000年9月にマサチューセッツ州ボストンで設立されたIT企業で、「既存のデータウェアハウスの10~100倍のパフォーマンスを半額で実現する」という性能を謳う「NPS(Netezza Performance Server)システム」の出荷を2003年に開始。2005年には日本法人(日本ネティーザ)も設立し、「小売や流通、金融などの業界での導入が増えています。海外は電話会社が顧客の行動やネットワーク施設の最適化を実現するために導入しています」(ダグラス氏)という状況とのこと。では、NPSはどのようにしてデータウェアハウスの高速化を実現しているのだろうか?
(次ページ、「パフォーマンスの秘密は独自アーキテクチャにあり」に続く)