ビッグデータのメリットはすでにそこにある
“ビジネスでの価値は事例が語る”IBMが考えるビッグデータ
2012年05月16日 09時00分更新
グローバルでビッグデータにいち早く取り組んできたベンダーの1つがIBMだ。「Smarter Planet」の一環として、知見をビジネスに活用する同社のビッグデータ戦略について、日本IBM ソフトウェア事業 インフォメーション・マネジメント事業部 マーケティング・マネージャー 中林紀彦氏に聞いた。
Hadoopとストリーミング処理が技術的なブレイクスルー
もとより、IBMはインフォメーション・マネジメントの製品群でデータ管理や統合、分析、ガバナンスなどを手がけているが、いわゆるビッグデータ分野への取り組みを本格的に開始したのは、2008年のSmarter Planetのビジョン発表にさかのぼる。ここでは「ニューインテリジェンス」という用語を用い、爆発的に増えるデータから知見を得て、ビジネスに活用するというアナリスティック分野にフォーカスしていくことを宣言。クイズに答えるコンピューターとして話題になった「WATSON」も、ビッグデータへの挑戦の1つといえる。
以降、IBMのインフォメーション・マネジメント事業部では、データベースの「DB2」や「Informix」、インテグレーションツール、マスターデータ管理、データウェアハウス(DWH)製品を中心に、ネティーザ(Netezza)のDWHアプライアンス、Hadoopベースの分散処理環境、CEP(Complex Event Processing)エンジンなどビッグデータ向け製品を次々と市場に投入している。「今まで構造化データの分析を中心に取り組んできたのですが、Smarter Planetの発表を機に、非構造化データを中心としたVariety(多様性)、Velocity(頻度)に対して枠を拡げてきました。テクノロジー面では、ビッグデータを活用できる体制がかなり整ってきています」(中林氏)という。ビッグデータという用語で始めたわけではなく、継続的な取り組みとしてデータ分析があるというのが、IBMのスタンスだ。
このうち中林氏が技術的なブレイクスルーと考えているのが、やはりHadoopをベースにした分散処理だ。とはいえ、Hadoopを単に並列で並べただけではコストも、管理の手間もかかる。また、既存のRDBやBIとの統合、セキュリティの確保、統合開発環境との統合などにも課題が残っている。これに対して、IBMはApache Hadoopを独自拡張し、「IBM InfoSphere BigInsights」として展開している。中林氏は、「Hadoopは、非構造化データを構造化データに落とし込むの有効です。両者をあわせて、新しい知見を得るのもビッグデータの1つのアプローチといえます」と、構造化データへの変換処理に効果を発揮すると説明する。
もう1つのブレイクスルーは、「IBM InfoSphere Streams」で実装されているデータをリアルタイムに処理するストリーミング技術だ。流れてくるデータをデータベースにストアしないストリーミング処理は膨大なデータをリアルタイムに扱うのには必須になる。「インメモリDBよりも一桁低い遅延でデータ処理できます。ある意味、Hadoop以上に大きいインパクトがあります」(中林氏)という。
3週間から15分へ!事例が語るビッグデータの価値
こうしたIBMにとってのビッグデータの定義や価値は、まさにSmarter Planetの旗印で生まれたさまざまな事例が語ってくれるものだという。
Smarter Planetのコマーシャルでも紹介される、スウェーデン王立工科大学では、ストックホルム市内の渋滞を緩和すべく、毎秒25万のGPSセンサーを読み取って、渋滞や経路予想や交通の可視化している。また、ウプサラ大学 スウェーデン宇宙物理学研究所では、毎秒6GB、1時間約21.6TB、そして1日では500TBのデータをIBM InfoSphere Streamsでリアルタイムで処理し、太陽の磁気嵐がどのように進むかを解析しているという。
こうした社会インフラ系や学術用途での事例のほか、企業での事例も増えている。大容量データの解析で効果を上げている典型的な会社として中林氏が挙げたのは、風力発電機を製造・販売しているデンマークのベスタス・ウィンド・システムズ(Vestas Wind Systems A/S)だ。
「ヨーロッパでは風力発電機のメーカーがひしめき合っており、製品だけでは差別化が難しいので、設置場所のコンサルティングがビジネスとして注目されています。風力発電機も、単に風が強いところに置くだけではタービンがすぐに老朽化してしまうので、適度な風が常時吹いているところに設置するのが重要です。そこで同社は3PBくらいの気象データを解析し、最適な場所をコンサルティングできるようにしました」(中林氏)という。具体的には、地球の表面を1×1kmのグリッドに分割し、各グリッドに150以上のパラメータを設定。これらを分析することで、設置場所や発電効率、発電寿命などを最適化していく。従来、こうした解析は3週間近くかかっていたが、HadoopベースのInfoSight BigInsightsを活用することで、同社は15分で実現できるようになったという。
その他、カードの不正使用を検知するために認証ログを分析するクレジットカード会社、Twitterのフィードを集めて売り上げ予想やマーケティング施策に活かす映画会社などの事例もある。
日本では、昨年の12月に発表されたネット証券会社のカブドットコムの事例がユニークだ。同社は、Twitterから特定の銘柄関連情報を抽出するという実験を昨年進めており、「46銘柄に関連する約4万3000のキーワードを付けて、これらに対するTwitterのつぶやきを集めています。1日900万行にものぼるこれらのデータの解析を、InfoSphere BigInsightsの分散処理で高速化しています」(中林氏)という。
業界ごとにビッグデータは違う?
このように、IBMではすでに数多くのビッグデータ事例を持っており、売り上げの増大や納期の短縮、新ビジネスの創出、競合他社に比べた差別化などを生み出している。効果があるのか? 定義はなに?というフェーズを飛び越して、すでにそこにあるソリューションというわけだ。また、ビッグデータはあくまで結果で、スモールデータからスタートする企業も多いという。「利用ログを分析し、不正利用を減らした前述のクレジットカード会社などは、もともとスモールデータから始めました。そして、彼らは、データの母数を増やし、頻度を上げることで精度が上がると思って、ビッグデータに取り組みだしたんです」(中林氏)。そして、実際にビッグデータ化したことで、不正利用を減らした。全体から見れば数%だが、コストインパクトは大きく、顧客満足度も向上させられる。いわば全件分析の恩恵といえる。
中林氏が挙げる課題は、やはり人材やスキルといったソフトウェア面だ。「データ解析は、ビジネス側の勘や経験がトリガーになります。その点、IT的なスキルや知識ではなく、アウトプットをある程度数学的に理解できる人が必要になりますね」(中林氏)。
もう1つはやはりビッグデータの活用イメージがまだまだ沸きにくい点。これに関して中林氏は、「IBMとして業界ごとでビッグデータの活用や定義していく」とよりわかりやすい施策を続けていくと説明した。
この連載の記事
-
第14回
ビジネス
“シリコンバレーの技術者集団”ではトレジャーデータを見誤る -
第13回
デジタル
セクシーなデータサイエンティストになるまで5年かけていい -
第13回
ビジネス
富士通のキュレーターに聞いたビッグデータの新しい活用論 -
第12回
ビジネス
ビッグデータに一番近いダイレクトマーケターが考える価値 -
第11回
ソフトウェア・仮想化
「データ」をビジネスにしないとIT業界では生き残れない -
第10回
ソフトウェア・仮想化
富士通のキュレーターが挑む「ビッグデータからものづくり」 -
第9回
ビジネス
ビッグデータを使うWeb事業者が外食産業に進出したら? -
第7回
ソフトウェア・仮想化
“データが語る時代の端緒”統計のプロが考えるビッグデータ -
第5回
ソフトウェア・仮想化
“非構造化データは宝の山”オートノミーが考えるビッグデータ -
第4回
ソフトウェア・仮想化
“常識を覆す迅速な仮説検証へ”JR東WBが考えるビッグデータ - この連載の一覧へ