このページの本文へ

センサーデータなどの大量読み書きに最適化、時間範囲指定のクエリも可能

バショー、IoT/ログなど時系列データ用NoSQL「Riak TS」

2015年11月25日 06時00分更新

文● 大塚昭彦/TECH.ASCII.jp

  • この記事をはてなブックマークに追加
  • 本文印刷

 Bashoジャパンは11月20日、同社が開発する分散型NoSQLデータベース(DB)シリーズにおいて、IoTセンサーデータやログデータなど、大量の“時系列データ(タイムスタンプのあるデータ)”を読み書きする用途に適したNoSQL DB「Riak TS」を発表した。12月より国内販売を開始する。

 Bashoジャパンは、米Basho Technologies(バショーテクノロジーズ)の日本法人。Bashoでは分散NoSQL DB技術をベースとして、Key-Value型データストアの「Riak KV」(旧称:Riak)、大容量オブジェクトストレージソフトウェア「Riak S2」(旧称:Riak CS)を提供してきた(関連記事)。

 分散型の高いスケーラビリティとスケールアウト/スケールインの容易さ、高い可用性/耐障害性といった特徴から、Riak KV/S2はすでに国内でも、NTTデータが提供するクレジットカード決済総合サービス「CAFIS」のほか、ヤフージャパン、GMOクラウド、国立病院機構などで採用事例を持つ。

Bashoの「Riak」シリーズ。すべて同じRiakコア上に構築されており、今回新たにRiak TSが追加された

 新製品のRiak TS(TS=Time Series)は、分散Key-ValueストアとしてのRiak KVの基本機能を継承しながら、時系列データの保存やクエリ、分析に適した最適化と機能追加が行われており、高速な読み書き処理ができる。

時系列データ向けに最適化された「Riak TS」の特徴(データの有効期限による圧縮機能は今後実装予定)

 Riakは元々、書き込まれた膨大な量のデータをクラスタ内の各ノード(サーバー)に分散保存する仕組みだが、TSでは書き込みの際、連続して書き込まれるデータの保存先をある程度まとめ、同一のノードに書き込むように最適化されている(コロケーション機能)。「たとえばIoTセンサーから1秒ごとにデータが送られてくる場合、1つ1つのデータを異なるノードに分散させて保存するのではなく、『1分ごと』などある程度まとめて保存する」(Bashoジャパン テクニカルマネージャー 鎌倉拓也氏)。

 加えて一定の時間範囲(レンジ)内のデータを指定して取り出しやすいよう、SQLライクな書式で範囲が指定できる「レンジクエリ」が使えるようになっている(上記図版参照)。

 上記2つの仕組みにより、特にある時間範囲内のデータをまとめて処理したい場合などに、読み出し処理を効率的かつ高速にできるのがRiak TSの大きな特徴だ。

 Bashoジャパン 経営戦略室 室長の森英悟氏は、Riak TSの適用例として、詳細な地点ごとの気象データ、大量の水道/ガスメーターから収集される使用量データ、オンラインゲーム事業者のログデータなどを挙げて説明した。

Riak KV/S2/TS、それぞれに適した業種とアプリケーションの例

■関連サイト

カテゴリートップへ

  • 角川アスキー総合研究所
  • アスキーカード