最新版「DVX 4.0」を発表、ティア1ワークロードへの対応を進める
Oracle RACもサポートしたデイトリウムのHCI、CTOにその技術を聞く
2018年04月25日 07時00分更新
ハイパーコンバージドインフラ(HCI)ベンダーのデイトリウムジャパンは2018年4月24日、同社HCIソフトウェアの最新版となる「DVX 4.0」を発表した。新たに搭載した「ピアキャッシュモード」によりSSD障害時のフォールトトレランスを実現し、VMware仮想化環境における「Oracle RAC」構成(最大4ノード、SSD版データノードのみ対応)もサポートしている。
今年2月に日本法人を設立し、国内での本格展開を開始したデイトリウム。前職ではEMC Data DomainのCTOを務めていた共同創設者&CTOのレッディ氏、元ティントリ テクノロジー担当VPのウォルターズ氏に、技術的な説明をしてもらった。
従来のHCIともCIとも異なるアーキテクチャを持つ「Datrium DVX」
新バージョンで追加された新機能を説明するために、まずはデイトリウム製品の特徴とアーキテクチャを簡単に振り返っておく(より詳細な説明は前回記事を参照してほしい)。
デイトリウムが提供するHCI「Datrium DVX」は、独自のストレージアーキテクチャによって高速なストレージI/Oを実現し、同時にグローバル重複排除/圧縮やスナップショット、リモートバックアップ/DRといったストレージ機能も標準で提供する製品だ。同社では、従来のHCIでは実現が難しかった、高トランザクションデータベースなどTier1クラスのワーククロードにも対応する“新世代のコンバージドシステム”を標榜している。
Datrium DVXは、仮想マシン上のワークロード処理を行うと共にプライマリストレージ機能を提供する「サーバーノード」(1~128ノード)と、セカンダリストレージ機能を提供する「データノード」(1~10ノード)により構成される。なおデータノードは、分散ストレージ技術(イレージャーコーディング)を用いたx86サーバーベースのストレージである(旧来のストレージ専用機ではない)。
各サーバーノードは、すべてのアクティブデータを内蔵SSDにキャッシュして、仮想マシンに高速なストレージI/Oを提供する。一方で、アクティブデータのコピーを含むすべてのデータはデータノードに保存されており、分散3重ミラーリング(RF3)を行ってデータの耐障害性を確保している。仮にサーバーノードがダウン(障害発生)しても、コピーデータはデータノードに保存されており、さらにすべてのノードが単一名前空間(単一ストレージプール)を共有しているため、仮想マシンをほかのサーバーノードに移動させて即座に復旧ができる。
「つまりサーバーノードはステートレス、一方でデータノードがステートフルという構成になっている。ここは一般的なHCIとの大きな違いだ」(ウォルターズ氏)
こうしたアーキテクチャのため、サーバーノード内に分散ストレージが組み込まれた一般的なHCIとは異なり、台数規模が拡大してもサーバーノード間のトラフィック(East-Westトラフィック)がボトルネックになるリスクが低い。これが、Datrium DVXがTier1ワークロード処理にも対応しうる大きな理由のひとつだ。
なおDatrium DVXでは、サーバーノード、データノードとも構成済みのアプライアンス製品が提供されている。ただし、サーバーノードについては、SSD搭載のx86サーバーにDVXソフトウェアをインストールして使うこともできる。サーバーやSSDのベンダーは問わないため既存のサーバー資産が活用でき、導入コストが抑えられるこの点も、顧客にメリットとして評価されているという(データノードについては十分なストレージI/Oを確保できる構成/チューニングが必要なため、現状ではアプライアンスとしてのみ提供)。
DVX4.0の新機能「ピアキャッシュモード」と「Oracle RACサポート」
前置きが長くなったが、DVX 4.0の新機能「ピアキャッシュモード(Peer Cache Mode)」について説明しよう。これは今回、Datrium DVXがOracle RACをサポートできた背景となる機能だ。
前述したようにDatrium DVXでは、サーバーノード上のSSDに、そのノードで稼働する仮想マシンのアクティブデータ全体がキャッシュされている。このとき重複排除/圧縮技術によって3~5倍のデータ削減率を実現しており、複数台のSSDを搭載している場合はそれをすべて使ってキャッシュデータを保持するかたちで、データを保護する。
それでは仮に、サーバーのRAIDコントローラー障害などによって、あるサーバーノード上にある「すべての」SSDが利用できなくなった場合はどうなるのか。従来のDVXでは、データノードに保存されているデータを別のサーバーノードにコピーして、仮想マシンを縮退運転させていた。これは仮想化環境における一般的な対処法と同じだ。
ここでピアキャッシュモードを使うと、SSDが故障したサーバーノードが、別のサーバーノード上のSSDキャッシュにアクセスできるようになる。つまり、別のノード上にあるデータにアクセスしながら、仮想マシンは元のサーバーノード上で稼働させる仕組みだ。このときのフェイルオーバー処理、および元のサーバーノード上のSSDが復旧した場合のテイクバック処理は自動的に行われると、レッディ氏は説明した。
「データノードにはHDD版、SSD版の2モデルがあるが、多くの顧客は大容量を求めてHDD版を選ぶ。ここでサーバーノードのSSDキャッシュがすべて故障した場合、データノードのHDDにアクセスして稼働を継続するのは低速であり、それよりもほかのサーバーノードにあるSSDにアクセスするほうが高速だ。それがピアキャッシュモードの主な役割となる」(ウォルターズ氏)
このようにピアキャッシュモードは、主には障害発生時の可用性を高める機能として利用されるが、その技術を転用してOracle RACクラスタにも対応している。
Oracle RACは、複数のノード上にあるデータベースインスタンスが、ストレージ上にある単一のデータベースファイルに同時アクセスしてトランザクション処理を行うHAクラスタ技術だ。だがDatrium DVXの場合、データノードはあくまでセカンダリストレージであり、データノード上のデータベースファイルに対して複数インスタンスから同時アクセスすることができない(データベースの一貫性が維持できない)。
そこで、どれかひとつのサーバーノード上にあるデータベースファイル(キャッシュ)を「マスターデータベース」として扱い、その他のサーバーノードで稼働するデータベースインスタンスは、ピアキャッシュモードを使ってこのマスターデータベースにアクセスするかたちを取る。これにより、vSphere環境でのOracle RACクラスタをサポートした。
ウォルターズ氏は、同様に複数サーバーインスタンスから単一ファイルへのアクセスを必要とするアプリケーションはOracle RAC以外にもあるため、データの確実性を担保しながら徐々に対応アプリケーションを拡大していく方針だと語った。
クラウドバックアップ「Cloud DVX」の無償プログラムも開始
今回は「Cloud DVX無償トライアルプログラム」の提供開始も発表されている。これは、2018年9月末までに購入されたDatrium DVXに対し、Amazon Web Services(AWS)を利用したクラウドバックアップオプションを1年間、容量1TBまで無償で提供するものだ(AWSの利用料金は別途かかる)。
このCloud DVXでも、少しユニークな方式がとられている。単にAWSのS3ストレージだけを使うのではなく、EC2上にDatrium DVXインスタンスを立てることで、あらかじめローカルで重複排除/圧縮を適用した差分データのみを転送することができる。これにより、単純に全バックアップデータをS3に直接保存する場合のコストの「10分の1程度で済む」と、レッディ氏は説明した。今回の無償プログラムも、Cloud DVXで得られるコストメリットを実感してもらうためのものだという。
「アップルの『iCloud』バックアップのように簡単に使えることを目指して、AWSリソースのデプロイなどの複雑な作業はすべてCloud DVXが行う仕組みだ。重複排除/圧縮済みでデータ転送量が少なく、また、転送された差分データはCloud DVXが自動的に統合処理を行うため、リストアの際にはひとつの(統合済みの)ファイルだけをダウンロードすればよい」(レッディ氏)
なお将来的には、クラウド上のDVXでDR環境をホストするクラウドDRの機能も計画されているようだ。また、DVX 4.0ではAPIも初めて公開した。
「Datrium DVXではプライマリストレージ、セカンダリストレージ、そしてクラウドバックアップをすべてカバーしている。従来のシステムではこれらが別々のベンダーから提供され、管理も別々になっていた。この3つが連携して稼働することには価値がある」「アップルやハーレーダビッドソンがそうであるように、われわれもファン、それも“熱心なファン”を獲得したいと考えている」(レッディ氏)