このページの本文へ

アイシロン、グリーンプラムも参戦した強力な布陣を披露

EMC、「ビッグデータ分野のリーダーになる」と宣言

2011年07月07日 15時00分更新

文● 渡邉利和

  • この記事をはてなブックマークに追加
  • 本文印刷

7月5日、EMCは同社の「ビッグデータ」への取り組みに関する説明会を開催した。同社の取り組みは単にストレージ・ハードウェアでの対応ということに留まらず、解析のためのプラットフォームを含む上位のソフトウェアレイヤまで包括するものになっている。

ビッグデータは単にでかいだけじゃない

 まず登壇したEMCジャパンの代表取締役社長の山野 修氏は、まずビッグデータについて「分析処理することで、今後、企業の競争力の向上や社会問題の解決に役立つことが可能な大規模で複雑なデータ」だという定義を紹介した。

EMCジャパンの代表取締役社長の山野 修氏

 従来の延長上にある“単にサイズが大きいだけのデータ”ではなく、“新しいタイプの巨大データ”だと説明した。さらに、具体的なビッグデータとして「ソーシャルメディア内のテキストデータ」「GPSなど、時々刻々と生成されるセンサーデータ」「ボリュームが膨大かつ、構造が複雑で、従来の技術では管理や処理が困難だったデータ」といった例を挙げた。その上で、EMCがこれまでさまざまな企業買収を行なってきた過程を『EMCの「クラウド/ビッグデータ」への旅路』として紹介し、ヴイエムウェア、RSAセキュリティ、データドメイン、グリーンプラム、アイシロンといった企業名を挙げた上で、これらの企業の買収によって得られた製品や技術がビッグデータの取り扱いを可能にする、という認識を示した。なお、同社が掲げるメッセージとして、2009年には“クラウドへの旅路(Journey to the Cloud)”が、今年2011年には“クラウドとビッグデータの交差”に変わっていることも紹介した。

EMCの「クラウド/ビッグデータ」への旅路

EMCのビッグデータ「アーキテクチャ」

 同氏は、ビッグデータに関して「構造化データ」「非構造化データ」という従来の分類に加えて「半構造化データ」という新しい種類のデータが出現していると指摘し、これを取り扱うためのストレージシステムとしてはアイシロンに代表されるスケールアウトNASが、また、データ分析の分野ではグリーンプラムによるGreenplum DatabaseやHadoopが有用だとして、近年の企業買収がビッグデータのハンドリングに焦点を当てたものだと位置づけた。

EMCのソリューション製品群

スケールアウトNASとビッグデータの関係

 続いて、7月1日付けでEMCジャパンと旧アイシロンシステムズが合併/統合されたことを受けて、旧アイシロンシステムズの代表取締役から新設されたアイシロン事業本部の本部長に就任した江尾 浩昌氏がスケールアウトNASのメリットやビッグデータを格納するストレージとしての優位性について説明を行なった。

EMCジャパン アイシロン事業本部長 江尾 浩昌氏

 同氏は、従来型のRAIDストレージでビッグデータを格納する場合の課題として「データの増加に合わせた拡張が困難」「パフォーマンスボトルネックが発生」「管理が複雑で運用負荷が高い」「単一障害点による可用性の低下」「低いROI」といった点を挙げ、スケールアウトNASによってこれらの問題点が解決できるとした。

ファイルベース・ストレージの成長の様子

アイシロンのスケールアウトNASの特徴

上記のスライド「アイシロンのスケールアウトNASの特徴」に誤りがあったと、EMCジャパンより連絡がありました。スライド中のIsilonビッグデータ・ストレージのパフォーマンスに「850GB/秒」とありますが、正しくは「85GB/秒」となります。スライドは初出時のままとなっております。ご注意ください。(2011年7月7日)

 また、同氏は最近のストレージ市場の傾向としてファイルストレージがブロックストレージを大きく上回る成長を遂げており、ファイルベースのビッグデータも増えていることから今後も引き続いてスケールアウトNASには大きな成長が望めるという見通しを示した。同氏は、アイシロン製品のユーザー事例として大日本印刷の半導体製造のためのフォトマスクのCADデータの格納に採用された例や、米国のCGアニメーションスタジオであるゾイック・スタジオでハイパフォーマンスを達成するために採用された例などを紹介した。

構造化されることでデータは目黒のさんまへ?

 最後に、EMCジャパンの常務執行役員 ストラテジー・アライアンス統括本部長の徳末 哲一氏が、グリーンプラムを核としたビッグデータ解析のためのソリューションを紹介した。なお、同氏は約1年前にグリーンプラムの日本法人設立の準備をしていたところで米本社の買収を受けてEMCジャパンに参加したという経緯だという。

EMCジャパン 常務執行役員 ストラテジー・アライアンス統括本部長 徳末 哲一氏

 同氏は、従来のコンピュータによる構造化データの取り扱いはコンピュータ側の都合/制約によるものだとし、「構造化することで失われてきた情報が山ほどある」と指摘した。同氏はこの状況を落語の『目黒のさんま』にたとえて「油抜きされて味が落ちたデータ」だという。さらに同氏はビッグデータの具体的な活用例としてAmazon.comのレコメンデーションエンジンを取り上げ、誰が何をいついくらで購入した、といったPOSデータのような構造化されたデータからは抜け落ちている情報の例として、購入までにどのような製品のページを見たのか、それぞれの製品ページにどのくらい滞在したのか、過去にどのような製品を購入しているのか、といった、従来の構造化の枠に収まらない大量のデータを収集、蓄積した上で分析することで「本人以上に本人の好みを分かっている」というほどの高度な推奨が可能になっている、と紹介した。

構造化データと非構造化データの連携

 構造化データの枠に収まらない大量のビッグデータを扱うのであれば、構造化データを前提とした既存のRDBMSだけでは対応が難しいことは明らかで、ここに分散型データストレージであるHadoopや解析エンジンとしてのmap/reduce、Hadoopディストリビューションとして位置づけられるGreenplum HDおよびGreenplum Databaseのシェアードナッシング・アーキテクチャに基づく「スーパーパラレル」なデータレイヤが分析のプラットフォームとして強みを持つとした。その上で同氏は、「Amazonや日本の楽天のような先進的なユーザー企業が実現している最先端のソリューションを、EMCが全てのユーザー企業向けに提供していく」というビジョンを語った。

ビッグデータに対するGreenplumのアーキテクチャ

被買収企業の出身者がビッグデータを先導?

 なお、徳末氏は冗談めかしながらも「EMCジャパンでビッグデータへの取り組みを推進している3名がすべて被買収企業の出身だ」という点を指摘した。グリーンプラムの徳末氏、アイシロンの江尾氏はもちろん、山野社長も旧RSAセキュリティの出身で、いわゆるEMCの生え抜きではない。山野社長はこの8年のEMCのR&D投資が総額105億ドル、M&A投資が140億ドルに達していることを紹介し、さらに2010年の実績では、売り上げの12%をR&Dに、17%をM&Aに投資した計算になると明かしている。これは自社での技術開発と積極的な企業買収をバランス良くかつ積極的に行なっていることの表われだが、なによりも同社の買収戦略の強みは、徳末氏が指摘したとおり、被買収企業の人材がEMCでも先頭に立ってビジネスを推進している例が少なからず見られる点だろう。一般的な企業買収では、買収後数年で被買収企業の人材はすっかりいなくなってしまうような例も珍しくはないことを考えると、その特徴が実に印象的なものに思えてくる。

 “ビッグデータ”というキーワードは、このところITベンダー各社から次々にメッセージとして発信され始めており、クラウドに続く新しい流行の兆しがある。これまではデータ処理を担うソフトウェア側からのメッセージが目立っていたが、実際にデータを格納するプラットフォームを握っているEMCは、そのポジションを活かしてこの分野でも独自の存在感を発揮することになると期待される。

■関連サイト

カテゴリートップへ

  • 角川アスキー総合研究所
  • アスキーカード