バックアップを変える重複除外ストレージ「Data Domain」 第4回
本番データで検証した重複除外の効果とレプリケーションの現実味
悩める管理者に贈るData Domainのリアルな検証結果
2012年04月10日 09時00分更新
前回までの3回でEMCジャパンのData Domainがバックアップにもたらす大きなメリットについては理解いただけたと思う。しかし、現場での効果を懐疑的に思う読者も多いかもしれない。そこで最終回は実データでData Domainのバックアップを試した、まさにガチンコの調査を披露しよう。
Data Domainのバックアップは「絵に描いた餅にならないか?」
バックアップデバイスとしてディスクベースのData Domainを用いると、磁気テープに比べて管理の手間は大幅に低減され、遠隔地へのレプリケーションなども容易になる。問題は、実際の現場できちんと動作するかという一点であろう。重複除外は宣伝文句通り機能するのか? バックアップ作業自体は省力化されるのか? そして、遠隔地へのレプリケーションはきちんとバックアップウィンドウに収まるのか? これらは実データできちんと調べてみないとわからない。そこで、今回はとあるシステムインテグレーターの協力をいただき、以下の構成でData Domainのバックアップを検証してもらった。
バックアップ対象はマイクロソフトのSQL ServerのDBダンプファイルを使った。毎日更新がかけられる本番の業務データで、容量は100GB強になる。本番サーバーからダンプをとり、Symantec Backup Execを用いて、Data Domainにバックアップするという構成だ。サーバーはXeon 2.66GHzを搭載したHP ProLiant ML110 G7で、Data Domainはエントリモデルの「Data Domain DD160」を採用している。さらに、Backup Execで取得されたData Domainのバックアップ領域は、東京から大阪のData Domainまでレプリケーションが行なわれる。東京・大阪間の回線は、200MbpsのWAN回線を用いている。
なお、今回の検証では、バックアップ、レプリケーションともに10日間継続して行なった。重複除外は、期間が長ければ長いほど効果が出やすいためだ。ローテーションも、週末にフルバックアップという標準的なもの。ただし、テープデバイスとの比較は行なわなかったので、ご了承願いたい。
10日間でデータ量96%削減の重複除外効果
まず、初回のバックアップでは、対象データが104.8GBだったが、重複除外を行なった結果、Data Domainでの使用容量はなんと12.3GBまで削減された。重複除外率(データ量削減率)は88%になり、大幅なデータの削減効果が認められた。スループットは、4.3GB/分で、所要時間は31分43秒となった。かなり高速だ。
初日以降は当然、更新部分のみの重複除外になるため、2日目は2.5GB(重複除外率(データ量削減率)97.7%)、3日目は2.0GB(重複除外率(データ量削減率)98%)と、使用容量はどんどん減っていく。6日目のフルバックアップは初回と同じ程度の使用容量・重複除外率に戻ったが、10日経った時点で、合計の使用量は42.6GBに収まった。以下の通り、重複除外前の合計量は1067.4GBだったので、最終的な重複除外率(データ量削減率)は約96%。本番データを使い、しかもローテーションを再現したことで、実際の重複除外の強力な効果をまざまざと見せつけられた結果となった。
次に東京から大阪までのレプリケーションについても調べてみた。重複除外後のデータを200Mbps WAN経由で転送するため、所要時間が概して5時間に収まっている。もちろん10GB強を転送するのは初回だけで、2回目以降は大幅に転送データも減る。これはWANでの転送を調べたパフォーマンスモニターを見れば明らかだ。
重複除外を行なわなければ、100GB強のデータをWAN経由で転送しなければならず、ジョブが終了する前に次のジョブが始まってしまう。災害対策として構築したレプリケーションの仕組みも、事実上「絵に描いた餅」となるわけで、重複除外の技術は不可能を可能にするバックアップ技術といえる。
●
今回の実証では、Data Domain最大の特徴である重複除外により、対象となるデータ自体が大幅に削減されることがわかった。障害時や災害からのリカバリもスピーディに行なえる。しかも既存のバックアップソフトやローテーションを変更することなく、単にデバイスをテープドライブからData Domainに入れ換えるだけで、こうしたD2Dと重複除外のメリットを享受できる。前回までの3回で説明したこれらの内容を勘案すれば、バックアップに悩む多くの管理者は魅力的に感じるはずだ。
この連載の記事
-
第3回
サーバー・ストレージ
磁気テープを使う管理者Sの嘆きとData Domainへの期待 -
第2回
サーバー・ストレージ
価値のあるD2Dを実現するData Domainの重複除外とは? -
第1回
サーバー・ストレージ
磁気テープのバックアップをやめるこれだけの理由 -
サーバー・ストレージ
バックアップを変える重複除外ストレージ「Data Domain」 - この連載の一覧へ