このページの本文へ

5日間のトレーニングでデータサイエンティストとしての基礎を学ぶ

EMCジャパンがデータサイエンティスト育成の取り組みを披露

2013年04月22日 13時00分更新

文● 渡邊利和

  • この記事をはてなブックマークに追加
  • 本文印刷

4月19日、EMCジャパンは同社のデータサイエンティスト育成支援とビッグデータ活用支援のためのコンサルティングサービスに関する説明会を開催した。ビッグデータ活用のためにはまず必要なスキルを備えた“データサイエンティスト”を育成する必要があると指摘されるが、そこに向けた直接的な取り組みとなる

データサイエンティストになる方法

 まず、同社のマーケティング本部 本部長の上原 宏氏が、3項目の“EMCジャパンの願い”を明らかにした。その内容は、「ITのコスト削減だけが議論されるのではなく、ITがビジネスをリードできるような環境を整えるために」「日本が取り残されてビッグデータ後進国にならないように」「日本発のビッグデータを活用した先進事例が、世界に向けて発信されるように」となっている。この“願い”が、同社がデータサイエンティスト育成に取り組む動機だと見て良いだろう。

EMCジャパン マーケティング本部 本部長 上原 宏氏

 次いで、エデュケーションサービス部 ソリューション・コンサルタントの浜野 崇氏が、同社が現在提供中のデータサイエンティスト育成コース「Data Science and Big Data Analytics」の内容について紹介を行なった。

EMCジャパン エデュケーションサービス部 ソリューション・コンサルタントの浜野 崇氏

 同コースは、基本的にはEMCトレーニングセンタージャパン(所在地:川崎)で5日間の日程で実施されるトレーニングコースで、受講費用は30万円。同社が定義する「データ分析のライフサイクル」に沿って体系的な学習を行なう。大まかなプログラムとしては、“ビッグデータ分析入門+データ分析のライフサイクル”(1日目)、“データ分析の基本~「R」を使って”(2日目)、“先進的分析の理論と手法”(3日目)、“先進的分析の技術とツール”(4日目)、“分析結果の可視化とプレゼンテーション+課題チャレンジ”(5日目)となっている。

データサイエンティスト育成プログラム「Data Science and Big Data Analytics」のカリキュラム概要

 分析のための基本的な理論やツールの使い方を学ぶのはもちろん、可視化やプレゼンテーションまでカバーされているのが特徴だ。これは、単にデータを分析するだけではなく、分析結果をビジネスに活かしてこそ、という考え方に基づくものだ。このトレーニングコースを受講するだけで誰でも即第一線のデータサイエンティストとして活躍できるわけではないが、まず身につけておくべき基礎は網羅されていると評価できる。

EMCによる、データサイエンティストの主要な3つの役割と、それに必要なスキル

 ただし、これだけの内容を5日間のトレーニングコースで吸収するには受講者側にも相応の準備が求められることも確かだ。コースの受講前提条件には、「統計の基礎レベル・コースにあるような基礎的な統計をしっかり理解しており、豊富な経験があること」「Java、Perl、Python(またはR)などのスクリプト言語の使用経験」「SQLの使用経験」が挙げられている。今後データサイエンティストを目指す人がどのような準備をしなくてはいけないのかを考える上で参考になるだろう。

過去の成功体験を脱却することの難しさ

 最後に、同社のコンサルティング部 EIM&Aチーム マネージャーの内田 信也氏が、同社の「データ・サイエンスチーム立ち上げサービス」の概要について紹介した。

EMCジャパン グローバル サービス統括本部 コンサルティング部 EIM&Aチーム マネージャー 内田 信也氏

 なお、EIM&Aとは“Enterprise Information Management & Analytics”の意味で、“情報管理&分析”と訳されている。また、“データ・サイエンスチーム”とは、データサイエンティストを中核メンバーとし、ビジネスとITのブリッジ役を担う専門チームのことで、ビジネス側のBIアナリストやIT寄りのデータ・アナリストなどが参加することが想定されているものだ。いわば、ユーザー企業の社内にビッグデータ活用のための基本となる組織を発足させるための支援を行なうサービスとなる。

 同氏が指摘したこの作業の難しさの例として興味深かったのは、どうやってビッグデータ分析に対する信頼を勝ち取るかという点だ。つまり、ビッグデータ分析によって得られた結果が信頼に足るものだ、ということをユーザーが納得してくれない限りその先には進めないが、この信頼は簡単に勝ち取れるものではない。

 この点について上原氏は自身の経験を交えて語ったのは、過去の成功体験を脱却することの難しさだ。ビッグデータ活用の典型例として企業のマーケティング施策を決定する例が挙げられるが、従来これは担当者の経験に基づく勘で行なわれてきた。ビッグデータ分析の結果が従来の手法や判断を裏付けるものとなった場合には問題はないが、食い違っていた場合は担当者がその結果を簡単に受け入れることはなく、どうしても自身の判断の方が正しいと考えたくなる。この結果、企業におけるビッグデータ活用は「総論賛成、各論反対」という状況に陥りがちだという。

 ビッグデータ活用の難しさは、まずは実際に分析を行なえるデータサイエンティストなどの人材が不足していることにもあるが、事業担当者が「データに従って行動する」という新たな発想に転換することの難しさにもあるということが改めて実感できた。

■関連サイト

カテゴリートップへ

更新情報
特集