創業者からCData Virtuality誕生秘話が披露
アルプスでヨーデルをレコード化したら、事業が急成長 データ仮想化が必要になるまで
データ連携コネクターを提供するCData Software Japanは、4月に買収したデータ仮想化ソリューション「CData Virtuality」の日本でのローンチセミナーを開催した。創業者のニック・ゴロビン氏も登壇し、CData Virtualityの誕生秘話を披露。データ仮想化の必要性や事例、そして製品の特徴などについても説明した。
急成長しすぎてグローバルに分散したシステムでデータ統合が必要に
データ仮想化ソリューションのData Virtuality創業者のニック・ゴロビン氏の話は、オーストリアにあるアルプスの山村に住んでいたある老人の紹介からスタートする。彼は銀行のディレクターだったが、事業がうまくいかなくなったため、好きなことを事業化することにした。家のガレージで、地元のヨーデルバンドの演奏を録音し、レコードとして販売し始めたのだ。
ニッチなビジネスだったが、この手の音楽が好きな人に「刺さった」結果、事業は急成長を遂げる。世界のあちこちに拠点を作り、地元のオーストリアと北米にCD・DVD制作工場や(物理的な)倉庫を立ち上げるような、巨大なメディア企業になってしまった。15年後、彼はこのフォークミュージック事業をユニバーサルに売却するのだが、その間音楽以外のゲーム事業を立ち上げて、成長した結果に売却されたほか、北米のTVショーをドイツ語圏に輸入する事業も成功させた。
そして、このメディア会社のIT部門に所属していたのがゴロビン氏になる。拠点の新設やM&Aなどを経て、グローバルに拡がったシステムは、いつの間にか5つのERP、AS400でコントロールされたロボット倉庫、数多くのWebショップ、ロイヤリティや顧客の管理システムの統合などから構成される巨大な分散システムとなっていた。データエンジニアのゴロビン氏は、これらのシステムのデータ統合に挑むことになる。
しかし、ゴロビン氏が体得していた伝統的なやり方では、データ統合はうまくいかないとわかった。そこで注目したのが、複数のデータソースを仮想的に統合するデータ仮想化の技術だ。データソース自体はそのままに、必要なデータを仮想的なテーブルとして構成し、データアプリケーションが仮想テーブルにリクエストをかけると、データソースからデータを取得してくるというソリューションだ。
データ仮想化に加え、レプリケーション前提のETLも可能なハイブリッド構成
データ仮想化の技術は新しいものではなく、リンクドサーバーやリンクドテーブルといった技術ですでに利用しているユーザーも多い。さっそくいくつかの製品を試したところ、短期間にレポートを作るところまでは可能になった。しかし、データが大きくなると、性能面で難が出てきた。また、「履歴データを持てない」「データのインポートやクリーニングが不可」といった課題もあった。
こうした課題感から内製化されたシステムは、データ仮想化のレイヤーとレプリケーション前提のETLレイヤーの2層構造になった。複数のデータソースを仮想統合できるだけではなく、大規模データ性能や履歴データを重視したレプリケーションも可能になったわけだ。
ゴロビン氏たちが作ったこのデータ仮想化の仕組みは、社内のシステム統合で大きな成果を挙げただけではなく、顧客のシステムにも導入されることとなった。結果、ゴロビン氏は起業し、Data Virtuality(現CData Virtuality)を外販する道を選ぶ。投資対効果についてゴロビン氏は、「既存のソリューションに比べて、80%のコスト削減を実現し、インサイトを得るまでの時間は5倍速くなる。エンジニアとして厳しく見積もった結果の効果が5倍だ」と語る。
2012年から展開してきたData Virtualityだが、さまざまなデータを取り込むためのコネクターが欠如しているという課題があった。これがまさにデータコネクターを提供するCData Softwareによる買収につながる背景。今年4月の買収以降は、すでに200以上のデータソースとの接続を実現している。
「SQL=正義」だったCData Softwareが「データ仮想化」に挑む
Data Virtualityを買収したCData Softwareは北米ノースカロライナに本社を置くIT企業で、日本では宮城県の仙台に法人をかまえる。ドライバー、サーバー、SaaSなどさまざまな形態で、ユーザーが使い慣れたExcelやBI、データ分析ツールから、さまざまなデータソースにアクセスするためのコネクターを提供している。
CDataコネクターの対応データソースは、RDBMSはもちろん、各種ファイル・API、CRM/ERP、コラボレーション、マーケティング、Eコマース、アカウンティングなど、業界最多の270種類を誇り、kintoneやSansan、Yahoo!広告など日本固有のソースにも対応する。また、エコシステムと呼ばれるOEM供給も多く、データ系ソフトウェア・ツールの内部に組み込まれていることも多いという。
CDataはさまざまなデータソースに対してSQLでアクセスするコネクターを提供してきた。CData Software Japan代表の疋田圭介氏は、「SQLは正義。とにかくSQLを作ればどんなデータにもアクセスできるという、非常にニッチで極端な思想で、ビジネスをして参りました」と振り返る。
しかし、データアクセスの問題は標準SQLだけで解決できるわけではない。一番大きい課題はデータの巨大化で、転送や複製のコストもかかるし、アクセス管理や規制に対するガバナンスなども大きな負荷になる。「今までは買収したデータの会社を3~5年かけて1つのプラットフォームに入れていこうという話でしたが、今では3年では遅い。こうしたスピード感のある時代の中で、SQLでアクセスすることが一番の問題ではなくなっている」と疋田氏は指摘する。
こうしたエンタプライズのニーズに応えるデータ分析基盤が買収した「CData Virtuality」。統合後の製品は頭に「C」を追加しただけだ。もともと同社は「CData Sync」と言われるETLツールもラインナップしているが、エンタープライズレベルのデータ仮想化ソリューションとしてCData Virtualityが追加されることになる。