センサーデータなどの大量読み書きに最適化、時間範囲指定のクエリも可能
バショー、IoT/ログなど時系列データ用NoSQL「Riak TS」
2015年11月25日 06時00分更新
Bashoジャパンは11月20日、同社が開発する分散型NoSQLデータベース(DB)シリーズにおいて、IoTセンサーデータやログデータなど、大量の“時系列データ(タイムスタンプのあるデータ)”を読み書きする用途に適したNoSQL DB「Riak TS」を発表した。12月より国内販売を開始する。
Bashoジャパンは、米Basho Technologies(バショーテクノロジーズ)の日本法人。Bashoでは分散NoSQL DB技術をベースとして、Key-Value型データストアの「Riak KV」(旧称:Riak)、大容量オブジェクトストレージソフトウェア「Riak S2」(旧称:Riak CS)を提供してきた(関連記事)。
分散型の高いスケーラビリティとスケールアウト/スケールインの容易さ、高い可用性/耐障害性といった特徴から、Riak KV/S2はすでに国内でも、NTTデータが提供するクレジットカード決済総合サービス「CAFIS」のほか、ヤフージャパン、GMOクラウド、国立病院機構などで採用事例を持つ。
新製品のRiak TS(TS=Time Series)は、分散Key-ValueストアとしてのRiak KVの基本機能を継承しながら、時系列データの保存やクエリ、分析に適した最適化と機能追加が行われており、高速な読み書き処理ができる。
Riakは元々、書き込まれた膨大な量のデータをクラスタ内の各ノード(サーバー)に分散保存する仕組みだが、TSでは書き込みの際、連続して書き込まれるデータの保存先をある程度まとめ、同一のノードに書き込むように最適化されている(コロケーション機能)。「たとえばIoTセンサーから1秒ごとにデータが送られてくる場合、1つ1つのデータを異なるノードに分散させて保存するのではなく、『1分ごと』などある程度まとめて保存する」(Bashoジャパン テクニカルマネージャー 鎌倉拓也氏)。
加えて一定の時間範囲(レンジ)内のデータを指定して取り出しやすいよう、SQLライクな書式で範囲が指定できる「レンジクエリ」が使えるようになっている(上記図版参照)。
上記2つの仕組みにより、特にある時間範囲内のデータをまとめて処理したい場合などに、読み出し処理を効率的かつ高速にできるのがRiak TSの大きな特徴だ。
Bashoジャパン 経営戦略室 室長の森英悟氏は、Riak TSの適用例として、詳細な地点ごとの気象データ、大量の水道/ガスメーターから収集される使用量データ、オンラインゲーム事業者のログデータなどを挙げて説明した。