このページの本文へ

バックアップを変える重複除外ストレージ「Data Domain」 第4回

本番データで検証した重複除外の効果とレプリケーションの現実味

悩める管理者に贈るData Domainのリアルな検証結果

  • この記事をはてなブックマークに追加
  • 本文印刷

前回までの3回でEMCジャパンのData Domainがバックアップにもたらす大きなメリットについては理解いただけたと思う。しかし、現場での効果を懐疑的に思う読者も多いかもしれない。そこで最終回は実データでData Domainのバックアップを試した、まさにガチンコの調査を披露しよう。

Data Domainのバックアップは「絵に描いた餅にならないか?」

 バックアップデバイスとしてディスクベースのData Domainを用いると、磁気テープに比べて管理の手間は大幅に低減され、遠隔地へのレプリケーションなども容易になる。問題は、実際の現場できちんと動作するかという一点であろう。重複除外は宣伝文句通り機能するのか? バックアップ作業自体は省力化されるのか? そして、遠隔地へのレプリケーションはきちんとバックアップウィンドウに収まるのか? これらは実データできちんと調べてみないとわからない。そこで、今回はとあるシステムインテグレーターの協力をいただき、以下の構成でData Domainのバックアップを検証してもらった。

今回バックアップ検証のシステム構成

 バックアップ対象はマイクロソフトのSQL ServerのDBダンプファイルを使った。毎日更新がかけられる本番の業務データで、容量は100GB強になる。本番サーバーからダンプをとり、Symantec Backup Execを用いて、Data Domainにバックアップするという構成だ。サーバーはXeon 2.66GHzを搭載したHP ProLiant ML110 G7で、Data Domainはエントリモデルの「Data Domain DD160」を採用している。さらに、Backup Execで取得されたData Domainのバックアップ領域は、東京から大阪のData Domainまでレプリケーションが行なわれる。東京・大阪間の回線は、200MbpsのWAN回線を用いている。

 なお、今回の検証では、バックアップ、レプリケーションともに10日間継続して行なった。重複除外は、期間が長ければ長いほど効果が出やすいためだ。ローテーションも、週末にフルバックアップという標準的なもの。ただし、テープデバイスとの比較は行なわなかったので、ご了承願いたい。

10日間でデータ量96%削減の重複除外効果

  まず、初回のバックアップでは、対象データが104.8GBだったが、重複除外を行なった結果、Data Domainでの使用容量はなんと12.3GBまで削減された。重複除外率(データ量削減率)は88%になり、大幅なデータの削減効果が認められた。スループットは、4.3GB/分で、所要時間は31分43秒となった。かなり高速だ。

10日間のローテーションでの重複除外の効果。なお、6日目は、SQLインデックス張替えの為重複除外率が低下している

 初日以降は当然、更新部分のみの重複除外になるため、2日目は2.5GB(重複除外率(データ量削減率)97.7%)、3日目は2.0GB(重複除外率(データ量削減率)98%)と、使用容量はどんどん減っていく。6日目のフルバックアップは初回と同じ程度の使用容量・重複除外率に戻ったが、10日経った時点で、合計の使用量は42.6GBに収まった。以下の通り、重複除外前の合計量は1067.4GBだったので、最終的な重複除外率(データ量削減率)は約96%。本番データを使い、しかもローテーションを再現したことで、実際の重複除外の強力な効果をまざまざと見せつけられた結果となった。

10日間の重複除外前の容量と論理容量

10日間の重複除外の重複率をグラフ化

 次に東京から大阪までのレプリケーションについても調べてみた。重複除外後のデータを200Mbps WAN経由で転送するため、所要時間が概して5時間に収まっている。もちろん10GB強を転送するのは初回だけで、2回目以降は大幅に転送データも減る。これはWANでの転送を調べたパフォーマンスモニターを見れば明らかだ。

初回は転送時間がかかっている

2回目以降は転送時間が大幅に短縮

 重複除外を行なわなければ、100GB強のデータをWAN経由で転送しなければならず、ジョブが終了する前に次のジョブが始まってしまう。災害対策として構築したレプリケーションの仕組みも、事実上「絵に描いた餅」となるわけで、重複除外の技術は不可能を可能にするバックアップ技術といえる。

 ●

 今回の実証では、Data Domain最大の特徴である重複除外により、対象となるデータ自体が大幅に削減されることがわかった。障害時や災害からのリカバリもスピーディに行なえる。しかも既存のバックアップソフトやローテーションを変更することなく、単にデバイスをテープドライブからData Domainに入れ換えるだけで、こうしたD2Dと重複除外のメリットを享受できる。前回までの3回で説明したこれらの内容を勘案すれば、バックアップに悩む多くの管理者は魅力的に感じるはずだ。

■関連サイト

カテゴリートップへ

この連載の記事
ピックアップ