百家争鳴!ビッグデータの価値を探る 第14回
トレジャーデータの太田CTO、ほぼ1万字&無加工インタビュー
“シリコンバレーの技術者集団”ではトレジャーデータを見誤る
2013年07月03日 07時30分更新
最大の弱点はマーケティングが弱いところ
TECH 大谷:現状は、どんなユーザーさんが使っているのですか?
TD 太田:たとえばヨーロッパ最大のモバイルエクスチェンジであるMobFoxは、月間200億くらいのインプレッションがあり、1万5000以上のモバイルアプリからアクセスされています。もともと彼らも解析インフラを持っていたのですが、それがスケールしなかったんです。
そこで、トレジャーデータを使って、1人のエンジニアが14日間でスケールする解析インフラをスタートさせたという事例です。何百台ものサーバーで広告配信やダッシュボード提供を行なっていたのですが、われわれが提供しているFluentdのエンタープライズ版であるTDagentを導入し、プログラムを2行書き換えただけで、200億件/月のログデータがクラウドに溜まるようになりました。あとはサマライズしたデータをローカルのMySQLに持ってきて、解析すればOKなわけです。
TECH 大谷:とにかく手間なくビッグデータを使えると。
TD 太田:多くの企業にとってそうなのですが、インフラの管理はユーザーの本業ではありません。トレジャーデータを使うことで、エンジニアはより解析サイドに時間を割けることになります。
こうした事例を見て大谷さんであればしっくりくると思うのですが、トレジャーデータと同じモノを作ろうすると、オンプレミス側でいろんなものを組み合わせなければならないんです。ストレージ、コレクター、Hadoopのディストリビューション、データマート、ETL、BIなどがある。でも、これらが1個1個が高いので、データの価値はありそうだけど、10億円投資できますかと言われると、多くのお客さんは困ってしまいます。その点、トレジャーデータはこれらをクラウド側でワンストップで提供します。
今はBIとあわせたパッケージ化を進めていて、たとえばログを収集すると、パートナーのBIツールでKPIを表示できるというゲーム用のパッケージみたいなところまで来ています。お客さんからすると、とにかく考えなくて済む。「2~3週間後には結果が出ます」というのは、セールス上とても効果のあるメッセージです。
大きな会社のCIOの人と話すと、個人情報とか、取引情報とか、確かにクラウドに絶対出せないデータはあります。でも、新しく生まれるセンサーデータやログは、データと通信の匿名化・暗号化を正しく行なえばクラウドで解析できます。ビッグデータのソースって結局、時系列データになるんです。Fluentdはこういうデータを収集するのに向いています。
TECH 大谷:こうやって話を聞くとトレジャーデータのメリットはとてもわかりやすいのですが、けっこう「ビッグデータ on クラウド」でまとめられちゃいますよね。まあ、私もまとめちゃった本人ですけど。
TD 太田:そうなんです。芳川も、私も実は営業マンタイプで、ディールに目がいってしまうので、現時点でのわれわれの最大の弱点は、マーケティングが弱いところ。他のベンチャーは、バズワードとしてのビッグデータの使い方がうまい。結局、差別化を説明できないのが課題ですね。次の6ヶ月でなんとかしなきゃと思っています。
エンタープライズ市場に舵を切りつつある
TECH 大谷:こうしたお客さんはどうやってトレジャーデータにたどり着くんですか?
TD 太田:やはりわれわれのサイトを見て、コンタクトを取ってきてくれたり、ファウンダーのネットワークから来たり、あるいは(出資元の)Herokuみたいな他のPaaSから流れてきたりといった感じでしょうか。
現状、われわれはエンタープライズのお客様にフォーカスしようという舵を切ってます。3~4ヶ月前はスタートアップも拒まずに受けてきましたが、今後100億ドルを売り上げる規模に成長するためには、ある程度エンタープライズを穫っていく必要があります。DWHのアプライアンスとかって、日本では年間数十社/年程度ですが、けっこうそれでやっていけます。それをクラウドで数十、数百倍にするのは、それほど無理がないのではという考えで、ビジネスプランを練っています。
米国ではITのコンシューマライゼーションが進んでおり、ビジネスの世界でもITリソースは消費するものという理想に近づきつつあります。たとえば、データセンターに何か入れると、iTunes App Storeのようにインストールすると勝手に設定されるという世界です。Workdayとか、Salesforceに買収されたExact Targetといったベンチャーは、ITリソースの消費方法をビジネス目線に変えて上げて、IT部門がより必要なだけ消費できるようにしています。われわれもこうしたベンチャーたちと同じ種類のプレイヤーだと思っています。
TECH 大谷:課金体系についてはどう考えていますか?ビッグデータの場合、保存する容量や処理能力など、いろいろな要素がありますが。
TD 太田:今はCPUとストレージの二軸で考えています。データだけをすごく溜めるお客様もいれば、めちゃくちゃクエリをかけるお客様もいるので、フィットするプライシングモデルを探しています。VMwareやOracleもけっこうライセンス体系変えてたりするじゃないですか。われわれスタートアップですし、プライシングは一番難しいですね。
(次ページ、誰を雇わなくても、なにも考えなくても、データが溜まる)
この連載の記事
-
第13回
デジタル
セクシーなデータサイエンティストになるまで5年かけていい -
第13回
ビジネス
富士通のキュレーターに聞いたビッグデータの新しい活用論 -
第12回
ビジネス
ビッグデータに一番近いダイレクトマーケターが考える価値 -
第11回
ソフトウェア・仮想化
「データ」をビジネスにしないとIT業界では生き残れない -
第10回
ソフトウェア・仮想化
富士通のキュレーターが挑む「ビッグデータからものづくり」 -
第9回
ビジネス
ビッグデータを使うWeb事業者が外食産業に進出したら? -
第7回
ソフトウェア・仮想化
“データが語る時代の端緒”統計のプロが考えるビッグデータ -
第6回
ソフトウェア・仮想化
“ビジネスでの価値は事例が語る”IBMが考えるビッグデータ -
第5回
ソフトウェア・仮想化
“非構造化データは宝の山”オートノミーが考えるビッグデータ -
第4回
ソフトウェア・仮想化
“常識を覆す迅速な仮説検証へ”JR東WBが考えるビッグデータ - この連載の一覧へ