「Data Platform Conference Tokyo 2017」基調講演をレポート
日産も採用、ホートンワークスがHadoopディストロの国内事例を多数紹介
2017年10月18日 11時00分更新
ホートンワークスジャパンは10月10日、“データ駆動型ビジネス”をテーマとしたイベント「Data Platform Conference Tokyo 2017」を開催した(主催はインプレス)。
基調講演には、ホートンワークスジャパン 代表執行役社長の廣川裕司氏、米ホートンワークスの創業者でApache Hadoop PMCのSanjay Radia氏らが登壇。ホートンワークス製品の国内ユーザー事例や、2008年夏にリリース予定のHadoop 3.0の新機能、同社が9月に提供開始したサイバーセキュリティ対策製品「Hortonworks Cybersecurity Platform(HCP)」の機能を紹介した。本稿では基調講演で発表された内容のうち、国内ユーザー事例を中心に紹介する。
廣川氏によれば、同イベントに参加登録した約1000人のうち3割は製造業だという。この産業でデータ活用への関心が高いことがうかがえる。基調講演で廣川氏は、「世の中のデータ量は年率4%増加して2020年には44ゼタバイト(ZB)にもなると言われている。そのほとんどが非構造化データであり、これをどう活用するかが今後のビジネスのカギになる」と語った。
3番目の主力製品「HCP」をSOC向けに市場投入
ホートンワークスは、OSSのデータ分析ソフトのディストリビューション(検証済みパッケージ)を提供する2011年創業の企業。Apache Hadoop/Sparkディストリビューション「Hortonworks Data Platform(HDP)」、およびApache NiFi/Storm/Kafkaなどストリーミングデータ処理用途のOSSをパッケージした「Hortonworks DataFlow(HDF)」を主力製品としている。
今年9月に、「HDP、HDFに次ぐ3番目の主力製品」(廣川社長)として、Apache Metronを利用したSOC(セキュリティオペレーションセンター)向け製品「Hortonworks Cybersecurity Platform(HCP)」を市場投入した。1秒間に数百万イベントのセキュリティデータをリアルタイムに収集してサイバー脅威を検出する。
ホートンワークスは、創業時の2011年からクラウドパートナーとしてMicrosoft Azureと提携しており、Azure上でHDPのマネージドサービス「HDInsight」を提供している。また、今年9月にIBMとグローバルで戦略提携した。IBMはHadoop/Sparkディストリビューションの自社開発を中止し、今後はホートンワークスのHDPを標準Hadoop/Spark製品とすることを発表している。
三菱ふそうトラック・バス、LIXIL、リクルートがHDPを採用
基調講演では、国内のHDP/HDFユーザーの事例が紹介された。
三菱ふそうトラック・バスは、Azureから提供されるHDPベースのマネージドサービス「HDInsight」を使って、車両からのセンサーデータを分析するシステムを構築している。同社 CIOのLutz Beck氏は「毎日道路を走行している車両からは、交通渋滞、気象など様々なデータが取得できる。これらのデータを活用して新たなデータビジネスを生み出すのが我々の計画だ」と述べた。
LIXILは、IBM Bluemix上のHDPと、オンプレミスに置いたSAP HANAを組み合わせて情報分析基盤を構築した。「2011年に5社を統合して誕生した住宅設備メーカーLIXILは、各社のシステムがばらばらで重要な情報が各システムに散在していた。全社視点でデータを分析、レポートするための統合情報分析基盤が必要だった」とLIXIL 情報システム本部 Information Excellence部 部長の菖蒲真希氏は振り返る。
新たに構築した統合情報分析基盤では、業務システム、社外システム、IoT(住宅から得られる各種データ)から集めたデータについて、詳細データをHDPに置いて分析し、サマリーデータをSAP HANAに置いてKPIレポートなどを出力するという運用をしている。「HDPのシステム側にHANA VORAを置き、HANAからもHDPからも同じデータにアクセスできる仕組みになっている」(菖蒲氏)。
リクルートは、同社グループが運営する「リクナビ」、「じゃらん」、「ゼクシィ」、「SUUMO」などの約50のサービスから収集したユーザーデータ(行動履歴、Push配信ログなど)と、外部データ(IPアドレス、ツールバーデータなど)、事業データ(Oracle database)を統合して分析・活用するプラットフォームを構築している。
このデータ分析プラットフォームは「サーバー200台以上の規模感で、オンプレミスとAWS、GCPの各種クラウドサービスを組み合わせて使っている」とリクルートテクノロジーズ ビッグデータ部 データプラットフォームユニット ユニットリーダーの添田健輔氏は説明した。ホートンワークス製品は、オンプレミスのデータレイクとして導入している。
日産自動車がデータレイク構築にHDP採用
今回のイベントで初披露となる国内ユーザー事例として、日産自動車のHDP活用が紹介された。日産自動車は、車の走行データ、製造工程における部品の品質データなど、社内に蓄積される様々なデータを蓄積するデータレイクの構築にHDPを採用した。基調講演にビデオ登壇した日産自動車 グローバルIT本部 本部長の木附敏氏は、「日産は歴史の長い会社なので、社内のデータがサイロ化されて部署ごとのデータベース、特定の目的のためのデータウェアハウスが山ほどあった。これを統合するためにHadoopを活用した」と説明した。
社内データを1つのデータレイクに集約することで、特に電気自動車のバッテリー利用状況の分析や、クロスファンクショナルにデータをクロス分析する必要がある品質管理の分野でのデータ活用に取り組むとしている。「例えば、市場に出た自動車に品質問題が発生した際、それが製造段階で問題が出たケースがあったのか、どの工程の品質問題が原因なのかを特定するには部門横断でデータをクロス分析する必要がある。このような分野でうまく活用していきたい」(木附氏)。
* * *
Data Platform Conference Tokyo 2017基調講演では、そのほかに、米ホートンワークスの創業者のSanjay Radia氏による「Apache Hadoop 3.0」の紹介、Apache Metronの第一人者であるDave Russell氏による「Hortonworks Cybersecurity Platform(HCP)」の紹介があった。こちらの内容については、両氏へのインタビューと合わせて別途レポートする。