データ分析のためのスケーラビリティの高いデータベースを提供するテラデータ。IoTというキーワードが躍り出てきたデータ分析の市場で、どのような実績や強みを持つのか? 米テラデータCTOのスティーブン・ブロブスト氏に聞いた。(インタビュアー 大谷イビサ 以下、敬称略)
顧客との「共創」があるからこそわれわれは賢くなれた
――まずは今回の来日の目的について教えてください。
ブロブスト:2つある。まずお客様やわれわれの製品に関心を持っていただいている方に、現在テクノロジーを使っているのか、どのような機能強化を求めているのか聞き、理解すること。そして、今回のTERADATA UNIVERSEのイベントで、われわれのロードマップやビジョンを披露することだ。
テラデータは賢いお客様の声に耳を傾けてきたからこそ賢くなれた。われわれはライトハウス(灯台)カスタマーという将来的なビジョンを持っているお客様の要件を見ている。ドイツならシーメンス、米国ならイーベイ、われわれのエンジニアが共同開発している。今回提携を発表したYahoo! JAPANとも同じように共同開発していく予定だ。条件としては、できあがったものはわれわれの製品に取り込むことに許諾をいただけているところ。こうしたライトハウスカスタマーに対しては、新たにできあがった機能をフィーチャーリリースとして先んじて提供していたりする。
――なるほど、まさに共創なんですね。具体的な例があれば教えてもらえますか?
ブロブスト:最近ではJSONを用いたLate Bindingの技術がある。非常に不安定なWebログに対する技術で、イーベイのフィードバックをいただいて作ったものだ。もう1つは、ローコストでハイボリュームなExteme Data Platform。これもお客様の要望で作ったものだ。
もう1つ高可用性に関する拡張もある。もともとテラデータは基本的に信頼性が高く、基本的には計画以外の停止はない。とはいえ、システムにキャパシティを追加する際には、いったんシステムを停止させ、データを再配置しなければならない。クラウド時代にこれではダメだというお声をいただき、無計画の停止をゼロにするだけではなく、計画停止もゼロにしていこうとしている。次期バージョンには組み込まれる予定だ。
IoTはWebログ、ソーシャルメディアに続く第3のビッグデータ
――次にビッグデータの現状についてご意見ください。先日、足を運んだイベントにおいても、ビッグデータのブースはかなり縮小している印象を得ました。ブロブストさんから見てビッグデータやデータ分析の市場をどう理解していますか?
ブロブスト:前回、お会いした時、おそらくビッグデータという言葉は2~3年以内に使われなくなるだろうという話をした。それがまさに始まったようだ。ビッグかどうか関係なく、データの中にすべて包括される。グローバルでもデータという全般の概念に関する議論が深まっており、企業のデジタルトランスフォーメーションにおけるデータビジネスの重要性は高まっている。
――単純に言うと、規模にこだわらなくなってきたと。
ブロブスト:そうだ。むしろデータのもたらす価値の創出にフォーカスが集まってきたのだ。たとえば、データレイクをサイズだけで語るのは馬鹿げている。そこからどれだけの価値を引き出せたかが重要といえる。
――最近のIoT(Internet of Things)とデータ分析との関係はどうお考えですか?
ブロブスト:IoTはビッグデータの3つ目の波と捉えることもできる。1つ目はWebログであり、2つ目はソーシャルメディアであり、3つ目はセンサー。センサー=IoTだからだ。IoTやIoE、あるいはAnalytics of Everythingといった用語も基本的に同じで、トランザクションの下のレベルのやりとりからデータを引き出してくるという点ではどれも変わらない。
4つの先進IoT事例からわかる「データ」から「価値」への変え方
――IoTの事例について教えてください。ユニークなものはありますか?
ブロブスト:センサーで電車のデータ分析を行なっているシーメンスの話をしよう。彼らにとってIoTとはInternet of Trainsだ。つまり、鉄道の車両にセンサーを付けて、電車が遅れた場合はそれをお客様に通知するとか、あるいは遅れがあった場合には保守のタイミングを図っている。センサーとクラウドを使って、移動のエキスペリエンスを最適化しようとしているわけだ。
ドイツでは長距離移動の8割に飛行機が使われていた。そこにシーメンスがコネクテッドな電車を投入し、列車のスケジュールを最適化。今では定時運航率99.9%を達成した。その上で、「もしも列車の到着が15分以上遅延したら、運賃を無料する」というキャンペーンを張った。飛行機は遅延が常態化していたので、このキャンペーンは人々の関心を惹いた。現在では飛行機の利用が3割になり、列車の利用率が大幅に上がった。スケジュールはもちろん、障害に関してもいち早く対応できるようになり、鉄道会社にとって大きな事業インパクトがあったわけだ。
――分析の結果が、きちんとシェアの拡大に寄与したわけですね。
ブロブスト:その通りだ。ボルボのコネクテッドカーの事例もある。ボルボは「2020年までにデータ分析を用いて、交通事故の死者をゼロにする」と宣言した。つまり、データを収集し、機械学習することで、自動車が衝突回避の仕方を覚えていくわけだ。車同士がぶつからないよう運転をアシストできるし、将来的には自動運転も視野に入ってくる。また、ボルボは自転車の利用率が高いスウェーデンの会社なので、自転車のヘルメットにセンサーを付け、自動車との接触事故を減らそうとしている。
――エアバックや車体の改良などではなく、データ分析で事故を減らすんですね。
ブロブスト:モンサントは農業分野のIoTだ。彼らは、土にIoTデバイスを埋め込んで、水分含有量などをセンシングし、どれくらいのタイミングでタネを蒔いたらよいかを調べている。これによって収穫量を最適化できるほか、どんな作物を埋めたらよいかもわかる。同じ作付面積で、収穫を上げることが可能になる。まだ事例があるのだが……。
――データ分析を価値に変えている素晴らしい事例ばかりです。ぜひ続けてください。
ブロブスト:あるハイテクメーカーの会社だ。これまで工作機械のメンテナンスはマイルストーン方式で、どれくらい使ったらメンテナンスをするといったやり方だった。こうしたマイルストーン方式はこれまでどれくらいの頻度で故障するかといった過去のデータで保守のタイミングを決めていた。しかし、工作機械が故障すると、作業員の手は空くし、生産量も落ち、コスト面での打撃も大きい。そのため、マイルストーン方式では非常に保守的に見積もられている。つまり、本来必要な回数以上のメンテナンスが盛られているのだ。
しかし、その会社は新しい「コンディション方式」を採用した。これは機械のパフォーマンスを見ながら、メンテナンスを決めていくというものだ。実際に使った時間を計算しないで、温度や振動、騒音、製品の品質などを見ている。これにより、リアルタイムで部品の交換やメンテナンスのタイミングを決めることができるようになった。こうすると保守のコストを4割下げることができ、予定外のダウンタイムを減らすことができる。もちろん、すべての会社が4割下げられるわけでもないが、だいたい10~40%下げることが可能だ。
――ハイテクの製造業だけではなく、幅広い分野で使えますね。
ブロブスト:その通りだ。コンディションベースのメンテナンスはハイテクだけではなく、自動車やドリルやポンプを使っている油田、さらには医療にも適用できる。
われわれの方がクラウドプラットフォームをうまく利用できる
――こうした事例になぜテラデータを用いるのでしょうか? 製品が選ばれる理由を教えてください。
ブロブスト:もっとも重要なアドバンテージは、スケールできるという点だ。IoTはやはりデータ量が桁違いに大きい。RDBやNewSQLなども含めて、本当に大規模なエンタープライズに対応できるのは、テラデータしかないと思っている。また、Late BindingやJSONなどの高度なデータ形式に対応できること、ストリーミング処理が可能なこと、そしてデータから価値を生み出した事例を豊富に持っている大きいと思っている。
――具体的な顧客の事例を聞くと、それは納得できます。
ブロブスト:多くのベンダーはできることをひたすらアピールしているが、実際の事例はあまり持っていないものだ。でも、お客様は科学的な実験をやりたいわけではなく、データからなるべく速く価値を生み出したいと思っているわけだから、そのリスクはなるべく低くしたいと考えている。その点、われわれはさまざまな事例を持っている。
――OSS系のプロダクトではなく、御社のような商用製品を選ぶメリットを教えてください。
ブロブスト:まずはっきりしておきたいのは、OSSとテラデータの関係はエコシステムであるということだ。競合するものではなく、共創するものだ。データレイクにあたるものは低コストなHadoopを用いて、プリプロセッシングを行なっていく。しかし、コンカレンシや複雑性のある処理はテラデータを用いる。こういうエコシステムが存在する。実際、先ほど話した事例の多くはHadoopといっしょに使っている。OSSとの親和性が高いテラデータだからこそ実現できる事例だ。
――先ほどの事例でも機械学習の話が出てきましたが、テラデータの機械学習の取り組みは?
ブロブスト:機械学習に関しては非常に先進的なアルゴリズムをTeradata Asterのプラットフォームに導入している。さらにSQLを拡張し、いわゆるNewSQLにも対応できるようにしている。それらすべてをソリューションとしてまとめ、Aster AppCenterで提供している。
クラウド時代のデータガバナンスのやり方とは?
――AWSやAzureなどのクラウドサービスとの関係も教えてください。
ブロブスト:彼らのプラットフォームをわれわれが利用していくという立場にある。AWS上でテラデータを動かすのも可能だし、日程は決定していないがAzure対応も提供が開始される予定だ。もちろん、AWSにはRedshiftがあり、マイクロソフトにはSQL Serverがあるが、彼らの持っているのはどちらかというと小規模なデータマートで、われわれのソリューションには追従できていないと考えている。彼らはスケーラブルなプラットフォームを持っているが、われわれの方がうまく使えると考えている。
――データ分析やIoTの隆盛で、クラウド上のデータレイクでどのようにデータのガバナンスを確保するかという議論が国内では起こっているのですが、これに関してブロブストさんはどうお考えですか?
ブロブスト:おっしゃるとおり、現在はルールの欠如があり、ガバナンスはゆるい状態にある。一番、重要なルールはお客様のデータを守ること、そしてお客様の利益のために使うことをきちんと確約することだと思う。データを集める段階で、用途や使い方を開示することだ。なにをやるかを説明し、それを実践する。
お客様のデータを許可なく販売したり、譲渡してしまうことは当然よくないことだ。ドイツやスウェーデンではこうした行為は禁止されているが、東南アジアではこうした規制がない。もし漏えいしたら、信用を失うが、どこに預けるかはお客様の選択になる。
たとえば私の会社がお客様のデータを集めて、サービスプロバイダーのデータレイクに預けるとする。もし、クラウド事業者が漏えいしてしまったり、ハッキングされてしまったら、それはよくないサービスプロバイダーを選んだ私の会社の責任になると思う。ストレージであり、プロセッシングであり、アウトソーシングするのであれば、やはり私の会社が責任を持って事業者を選ぶ必要がある。
――こうしたガバナンスというのは、国家がきちんと法規制すべきものなのか、業界団体が取り扱いを定めるものなのか、意見をいただけますか?
ブロブスト:これは文化によって異なるだろう。ドイツの場合は、国が規制をかけているし、国民もプライバシーを守るために規制をかけることを期待している。一方、米国の場合、国民は大きな政府を嫌うし、介入も好まない。そのため、業界団体がコンソーシアムを結成し、ルールを作っている。そしてルールを破った事業者に対しては競合他社によってつぶされていくことになる。企業を信用していないドイツ人と、政府を信用していないアメリカ人。どちらがよいというわけではなく、文化の違いというわけだ。