真夏の勉強会でネットアップに詳しくなる
未来を見通してた?Data ONTAP WAFLのこだわりを解剖
2012年08月08日 06時00分更新
副産物大きすぎ!WAFLのメタデータ
WAFLでは、ディスクへの書き込みと同時に、書き込み位置を示すメタデータもディスクに保存されることになる。このメタデータの存在は、処理のオーバーヘッドやディスク消費などを引き起こすのではという懸念や批判の元にもなったが、河西氏によるとData ONTAPの優位性を実現する源泉となっているという。
まず、メタデータとしてログを持つWAFLでは、編集において、既存ブロックに対する上書きではなく、新規ブロックに追記する形になる。つまり、履歴を管理した完全なジャーナルファイルシステムとなっているわけだ。
また、「FlexVolボリューム」と呼ばれる容量の仮想化機能も、WAFLの恩恵だ。従来のストレージでは必要なボリュームを事前にアサインする必要があるが、FlexVolではRAIDで構成されたディスクをまとめた仮想ストレージプールで共有化し、そこから動的にボリュームを切り出し、ボリュームを拡張・縮小できる。こうした柔軟な容量変更が実現できたのも、WAFLのメタデータにおいてデータとアドレスを仮想的に管理していたからだ。「WAFLを作った人間が、FlexVolを考えたわけではない。メタデータがあることで、結果的にFlexVolができてしまったという感じ」(河西氏)とのことで、WAFLの仕組みが仮想化に応用された実装例だという。
なお、このFlexVol自体はストレージコントローラーを仮想的に分割するマルチテナント技術にも応用されており、リソースの優先順位を付ける「FlexShare」とあわせ、ソフトバンクやIIJなどのクラウド事業者で多用されているとのことだ。
同じようなWAFLの応用例が2007年に実装された重複排除である。同一ブロックを重複とみなし、ディスクの利用効率を向上させる重複排除だが、これもWAFLの処理に違和感なく取り込まれている。WAFLでは4KBのブロック単位でデータを扱っているが、重複排除のためにフィンガープリントを収集するようにしたのだ。これにより、同一のフィンガープリントを重複としてみなし、無駄なディスク容量を回収。仮想化環境で平均70%、バックアップにおいて平均90%という高いセーブ率を実現した。
Data ONTAPの重複排除で特徴的なのは、競合となるEMC Data Domainのようなバックアップストレージではなく、プライマリストレージでの利用を前提としている点。また、性能面でアドバンテージのあるインライン処理ではなく、ポストプロセスで動作するという点だという。
最新のハードウェアや利用状況の変化にも追従
「物理法則のようにWAFLの動作原理から、Data ONTAPのさまざまな機能が説明できる」(河西氏)とのことで、WAFLはData ONTAPの機能を支えるコア技術となっている。ランダムな書き込みのシーケンシャル化という当初の目的を離れ、仮想化や重複排除、クラウド対応など、昨今重視されるストレージ機能のベースとなっているのだ。
一方で、Data ONTAPでは、最新ハードウェアに追従していく困難もあったという。ストレージという製品の性格上、ある程度枯れた技術を利用したいが、最新技術の導入が遅れるのも問題だ。その点、Data ONTAPもマルチコアCPUやディスクの大容量化などに対応しつつ、フラッシュメモリのような価格の急速な下落についても追従していく必要があったという。また、最近ではサーバーにおいてもWAFLと同じようにメモリに溜め込むアーキテクチャが登場しつつあるので、ストレージとの役割分担も大きな課題と説明する。
そして最大の課題は、サーバーの処理能力が上がったことで、書き込みデータが増えてきたことだ。WAFLの10秒を待たずにNVRAMがいっぱいになり、ディスクへの書き込みを実行しなければならないわけだ。「われわれの性能限界はNVRAMに書き込めないことを意味している。こうなるとヘッドをアップグレードするしか方法がない」とのことで、経験値的には余裕のあるスペック製品を進めているが、徐々に追いつかなくなっている。クラウドのように複数ユーザーのワークロードが増え、サーバー側もマルチテナント化されてきており、上からどんなデータが振ってくるか予想がつかなくなっている。こうした状況はネットアップでもそろそろ課題となっており、データ処理の優先順位を導入したり、次回の勉強会のテーマとなるCluster-Modeが必要になるという。
この連載の記事
-
第4回
サーバー・ストレージ
ネットアップ、適材適所のフラッシュ活用について語る -
第3回
サーバー・ストレージ
仮想化やDBベンダーに愛される「スナップショット」成功物語 -
第2回
サーバー・ストレージ
Data ONTAPのスケールアウト化を実現するCluster-Mode - この連載の一覧へ