2月22日、EMCジャパンは同社のビッグデータへの取り組みに関する説明会を開催した。説明を行なったのは、グリーンプラムの共同創業者で、現在は米EMC Greenplum製品担当 シニアバイスプレジデントを務めるスコット・ヤラ氏で、同氏はデータ分析の専門家として“データサイエンティスト”を育成することが重要だとした。
Greenplumの歩みとビッグデータ
スコット・ヤラ氏はルーク・ロネガン氏(現在はCTO)と2人で2002年にグリーンプラムを設立した。買収によって、現在はEMCに所属しているが、同氏がグリーンプラムを設立した時点から、現在の言葉で言うところの「ビッグデータ」への取り組みがテーマであり、「大量に生成されるデータからどうやって価値を引き出すか?」という問題に取り組んできたのだという。
現在は人間が直接生成するデータよりも“マシンが生成する”データの方が多くなっており、この状況を指して「データの産業革命」と呼ぶ人もいるという。Greenplum DatabaseおよびGreenplum Hadoopディストリビューションを核として構成される「Greenplum統合分析プラットフォーム」は、同氏によれば「ビッグデータ分析のための初めての統合システム」なのだという。
同氏は、米国ですでに始まっているビッグデータ活用の事例などを紹介しつつ、“データサイエンス”の確立の重要性を語った。データサイエンスはデータから価値を引き出すための科学的なアプローチであり、数学、コンピューターサイエンス、行動科学の成果を踏まえ、統合したような形になるのだという。同氏はデータサイエンスに取り組む人材を“データサイエンティスト”と呼び、こうした人材に対する需要が企業内で高まりつつあるとした。
EMCジャパンでは、同日付でデータサイエンティスト育成のための新しいトレーニングコース「Data Science & Big Data Analytics」の開設を発表しているが、同氏の説明は、同社がなぜこうしたトレーニングを実施するに至ったのかの背景説明となっていた。データが収集できても、そこからビジネスにつながる価値を引き出すことができなければ企業がビッグデータを扱う意味はないとも言える。使いやすいツールの整備は進んでいるが、やはり自社のビジネスに有用な価値を大量のデータから的確に引き出すためには相応の訓練が必要ということで、こうしたコースがEMCのみならず、ゆくゆくは大学などの学術研究機関などからも提供されるようになっていくことも考えられるだろう。