EMCの「XtremIO(エクストリームアイオー)」は名前の通り究極のI/Oを実現すべく、トップストレージベンダーの威信を賭けイチから開発されたオールフラッシュアレイだ。開発意向から製品投入にまで時間がかかったが、当初のコンセプトを確実に満たす製品に仕上がっている。
オールフラッシュアレイはなぜ必要か?
HDDの代わりに記録媒体をすべてをフラッシュで構成したオールフラッシュアレイが注目を集めている。フラッシュのメリットである高いI/O性能により、VDIやデータベースなどのアプリケーションを大幅に高速化できるのが大きなメリットだ。各社からオールフラッシュアレイ製品が次々投入されるなか、ストレージ最大手のEMCが先日発表したのが「XtremIO」である。最大100万IOPSという高いパフォーマンス、フラッシュに最適化した効率性、導入後すぐに利用できるシンプルさが大きな売りとなっている。
フラッシュアレイが求められる市場背景についてEMCジャパン システムズ・エンジニアリング本部 プロダクト・ソリューション統括部 ソリューション部 シニア・システムズ・エンジニア 笹沼 伸行氏は、「調査会社のレポートを見ると、やはりお客様がフラッシュに期待するポイントはパフォーマンスと効率性です。HDDの場合、パフォーマンスを求めると、どうしても台数が多くなります。その点、フラッシュはハードウェアを統合できるし、ソフトウェアコストも下げられます」と語る。もちろんフラッシュというと、まだまだ高価なイメージもあるが、「高速なHDDとエントリのフラッシュの価格差を比べると、2008年は40倍でしたが、今では3倍に下がっています」(笹沼氏)とのことで、購入しやすくなっているのも事実だ。
こうした中、フラッシュで構成したオールフラッシュアレイが必要な場面も登場しつつあるという。笹沼氏は、「多くの業務アプリケーションは、ストレージの全体5~10%をフラッシュ化すれば、パフォーマンスや効率化の効果を得られていました。しかし、10TB以上のデータベースを使用した分析業務や、多くのユーザーが利用するVDIのようなニーズを考えると、オールフラッシュアレイのような選択肢も必要になります」と語る。
最大で4台までスケールアウト可能なアーキテクチャ
XtremIOは、ストレージコントローラー、ディスクエンクロージャー(DAE)、バッテリーバックアップユニットなど複数のコンポーネントで構成された「X-Brick」と呼ばれる6Uのビルディングブロックで提供される。2台のストレージコントローラーはアクティブ-アクティブの冗長構成となっており、高い可用性を誇る。また、X-Brickあたり25個の400GBのSSD(eMLC)を採用し、物理容量は10TB。重複排除なしの論理容量は7.5TBを実現する。ホストポートは、iSCSI用の10Gbpsポート×4と8Gbps FCポート×4を搭載する。
ハードウェア面でのXtremIOの特徴は、スケールアウト可能という点だ。XtremIOでは、X-BrickをInfiniBandで接続し、最大4台までクラスター化。パフォーマンスと容量を拡張できる。クラスター内のコントローラー間でデータを均等に分散し、メモリも複数のクラスターで共有できる。「XtremIOで提供するスケールアウトアーキテクチャはIsilonと似ています。また、各コントローラー間でグローバルメモリ領域を効率的に共用できる点はVMAX譲りです。RDMA(Remote Direct Memory Access)で非常に高速なアクセスを可能にしています」(笹沼氏)とのことで、さまざまなEMCの技術が盛り込まれている。
とはいえ、XtremIOのハードウェアは基本的に汎用パーツを用いており、一部のベンダーのように独自のFPGAやフラッシュメモリーは用いていない。笹沼氏は、「特殊なハードウェアやカスタムなファームウェアを使うと、将来的な安定供給にも不安がありますし、機能強化や拡張も難しいでしょう。XtremIOで採用しているのは、コモディティのハードウェア。差別化ポイントはフラッシュを前提としたソフトウェアです」と語る。開発意向表明からリリースにまで時間がかかったのも、こうしたXtremIOのソフトウェア開発に注力したからというわけだ。
フラッシュを前提としたソフトウェアが最大の売り
一口にオールフラッシュアレイといっても、既存のディスクアレイ装置のHDDをSSDに置き換えただけという製品もある。しかし、HDDとフラッシュはそもそもハードウェア特性が大きく異なるほか、耐久性や書き込みの遅さなどフラッシュ特有の弱点もある。その点、XtremIOでは記憶媒体がフラッシュであることを前提に、安定した性能や効率性、データ保護を追求したソフトウェアを開発した。
まず、フラッシュへの書き込み回数自体を減らし、耐久性を向上するため、インラインでの重複排除を行なう。具体的には入力されたデータを4KBの固定長に分割し、フィンガープリント化。同一データを排除したのち、データの参照情報を含むメタデータはグローバルメモリ領域に、データ本体はフラッシュに書き込む。書き込むデータ自体が少なくなるため、セルの書き込み回数を減らし、性能も向上する。この重複排除により、X-Brickあたりの実質の有効容量は増加。たとえば5倍の重複排除率となった場合には、一気に37.5TBまで拡大する。また、データのコピーの際にもメタデータを更新するだけで、フラッシュへの追加書き込みは行なわないで済む。
また、ストレージの利用効率を向上するシンプロビジョニングを標準で実行する。重複排除のブロックと同じ4KBブロックをアレイ全体に分散して書き込み、動的に容量を計算する。物理容量を確保する必要がないので、無駄な書き込みは排除される。「とにかく余計なモノをSSDに書き込まないというのがコンセプトです。フラッシュの寿命も伸びますし、書き込み処理の性能も向上します」(笹沼氏)。
データ保護に関しては、「XtremIO Data Protection(XDP)」という独自のRAID拡張技術を採用する。XDPでは、行および対角線上のN+2のパリティを持つことで、ハイパフォーマンスなRAID1、利用効率の高いRAID5、二重パリティでデータ保護に優れたRAID6(0+1)のメリットを活かしつつ、なるべくユーザー領域に容量を割り当てられるように工夫されている。笹沼氏は「通常はパリティの部分などで20~50%は使えなくなりますが、XDPは8%にまで抑えています。ドライブ故障の場合も、2つのパリティを使うことで、高速にリビルドします。空き領域を使うので、ホットスペアも不要です」とそのメリットを語る。また、最大6本のSSDが1DAE内で連続して故障となった場合でも、すべてのSSDにおいて、故障前とリビルド後で同等のパフォーマンスを確保することが可能だという。
1000名以上のVDIに大きなパフォーマンスを
こうしたアーキテクチャを採用しているため、データ量が増加したり、突発的に多くのI/O要求が発生した場合でも、XtremIOは、常時安定したパフォーマンスでミリ秒未満の遅延を確保できる。
従来型のRAIDを前提としたディスクアレイの場合、ストレージの使用率が高くなると、空き容量を確保するためにデータを再配置するガベージコレクションが発生していた。しかし、ガベージコレクションが発生すると、CPUに負荷がかかるほか、SSDにも余計な書き込みが発生する。結果として、パフォーマンスや遅延が予測できなくなり、性能が不安定になる。これに対しXtremIOは、4KB単位で空いているところにデータを自由に配置できる。笹沼氏は、「競合ベンダーのフラッシュ製品では、ガベージコレクションで連続した書き込み領域を確保する必要がありますが、 XtremIOの場合には、連続する空き領域の状況に合わせて最適化できます。従って、ガベージコレクションも不要で、安定した性能を確保できます」と語る。
ランダムアクセスを前提としたXtremIOは、ずばり大規模なVDI環境、サーバー仮想化やOLTP系のデータベースなどが最適だという。「特にVDIは昨今、ユーザー数が増えているので、ブートストームや全体のパフォーマンスが大きな問題になりつつあります。現状はSASのドライブを並べているけど、データ量も増えてくると非効率なので、オールフラッシュを検討されるお客様も増えています」(笹沼氏)。
リリース前の事前導入において、既存のストレージとXtremIOを比較した検証データでも、「150のクローンを生成する時間が17.5時間から1時間に」「後処理では8%だった重複排除がインライン化したことで、52%にまで向上」「Oracle DBのアプリケーションではビジネスプロセス時間が半減」など高い効果が実証されているという。
フラッシュストレージの理想を追求した製品
XtremIOは、トップストレージベンダーであるEMCがフラッシュに対して真正面から向きあってできた製品だ。特に安定した性能、充実した可用性やデータ保護、高いスケーラビリティなどに関してはこだわりが感じられ、スピードのみを追求したベンダーと一線を画している。重複排除やシンプロビジョニングなど扱うデータをすべて4KBに統一したのも、シンプルさと効率性を極限まで追求した1つの形だと思う。
とはいえ、最大の売りは製品単体ではなく、XtremIOを含む豊富なラインナップかもしれない。フラッシュ関連製品だけでも、「XtremSF」と呼ばれるサーバーフラッシュカードやXtremIOのようなオールフラッシュアレイが用意されているほか、VMAXやVNX、Isilonなどのストレージ製品においても、コスト効率の高いハイブリッド構成を実現できる。
笹沼氏は、「バックアップのためにストレージを使っているところは、物理的な容量が大きいニアラインSASを並べた方が効率的ですし、データの利用頻度に偏りがある場合は、階層型でフラッシュを使ったほうがコスト効率も優れています。もはやVMAXは要りませんという競合ベンダーもいますが、すべてのデータをオールフラッシュのテクノロジーに任せることは、やはり現実的ではありません」と指摘する。あくまで用途に最適な製品の品揃えを提供できるのがEMCのメリットというわけだ。とはいえ、オールフラッシュアレイならではの用途がまだまだ見えにくいのも事実。XtremIOが切り開くフラッシュストレージの新しい可能性を期待したい。