このページの本文へ

バックアップを変える重複除外ストレージ「Data Domain」 ― 第1回

テープを捨てよ!EMC Data DomainでD2Dにしよう

磁気テープのバックアップをやめるこれだけの理由

2011年12月28日 09時30分更新

文● 大谷イビサ/TECH.ASCII.jp 記事協力●EMCジャパン

  • この記事をはてなブックマークに追加
  • 本文印刷

データの大容量化が進む昨今、「バックアップといえば磁気テープ」という常識はすでに通用しなくなっている。なぜ、磁気テープは限界なのか? D2D(Disk 2 Disk)バックアップを検討すべき理由とは? 重複除外ストレージ「Data Domain」を展開するEMCに聞いた。

データ爆発時代に磁気テープではもう限界!

NECが1974年5月に発表した磁気テープ装置「N7620」

 ハードウェアの障害、人的ミス、災害、セキュリティ侵害など、コンピュータにおいてデータを損失する原因は多種多様だが、こうしたデータを完全に保護するのが、バックアップの目的である。このバックアップのメディアとして、今まで多くの企業は磁気テープを用いていた。1980年代の汎用機の時代から、バックアップの歴史は磁気テープの歴史でもあった。

 磁気テープのバックアップはサーバー等にLTOやDDS規格の磁気テープ用ドライブを接続し、サーバー上のバックアップソフトを介して、保護対象となるデータを交換式のテープメディアに保存する。一般的には、週に一度フルバックアップを取得し、通常はデイリーの更新や差分のみをテープに格納するというローテーションを行なう場合が多い。テープメディアは社内のサーバールームに保管されたり、災害対策として遠隔地の倉庫に保管されることもある。こうした磁気テープによるバックアップは長い歴史を持ち、多くの企業で管理者の日常業務として根付いている。

 しかし昨今、このテープバックアップは、HDDを使う「D2Dバックアップ」に急速に置き換わりつつある。EMCジャパン BRS事業本部 シニアシステムズ・エンジニアの村山雅彦氏は、「今までは、ポータブルな磁気テープのメリットを活かして災害対策を行なうことが重要でした。しかし、技術進化が進んでおり、コストのバランスを維持し、信頼性や運用性を向上させる必要が出てきています」と語る。特に2011年の東日本大震災以降、災害対策の見直しとともにバックアップについて再検討するユーザーが増えているという。

EMCジャパン BRS事業本部 シニアシステムズ・エンジニアの村山雅彦氏

 この背景にはバックアップ対象となる企業の業務データ量が近年急激に増加し、磁気テープに限界が生じてきたことが挙げられる。データ量が増えると、当然ながら大容量のメディアが必要になり、バックアップにかかる時間(バックアップウィンドウ)も長くなる。これに対して、磁気テープで容量を超えるバックアップを行なうには物理メディアを交換する必要がある。もちろん、複数のメディアを交換可能なテープライブラリのような装置も存在するが、概して高価だ。また、メディアが増えると運用はきわめて煩雑になり、コストもかかる。しかも、バックアップされたビジネスデータは業務に直結する価値を持っているため、迅速にリストアする必要がある。サーバーの障害時でも、ユーザーの誤操作やウイルス感染などの際も、災害時も、確実にデータを戻さなければならない。

 こうした条件で、「処理自体が短く」、「瞬時にリカバリでき」、「しかも日々の運用の手間がかからない」という理想のバックアップを目指すのであれば、磁気テープに比べ、D2Dバックアップは有利な点が多い。D2Dバックアップであれば、安価なコスト、高い信頼性、そして運用負荷の低減などが実現できるという。

磁気テープのメリットはすでに失われている

 まずは転送速度や保存期間、容量単価などを軸に磁気テープ、D2Dバックアップ、そしてData Domainの特徴を現した下図を見ていただこう。

Data Domainが求められる背景

 そもそもバックアップにこうした磁気テープが利用されてきたのは、メディアの容量単価が安価だったからにほかならない。しかし、大量生産が前提のHDDの低価格化は著しく、この10年で磁気テープの容量単価を圧倒的に凌駕するようになった。特にSATA HDDの容量単価の下落は急速で、冗長化のために同容量のHDDを2台買っても磁気テープより安いくらいだ。磁気テープの存在意義であった価格的なメリットは、まず失われているのだ。

 また、バックアップウィンドウの短縮化に貢献する転送速度に関しては、テープの速度が強調されることも多い。しかし、村山氏は「最新のLTOなどでは、確かに磁気テープも高速かもしれません。しかし、そのドライブの速度を活かすには、あくまで複数のクライアントからのI/Oがある場合です。磁気テープはその速さを活かす使い方が難しいのです」と指摘する。つまり、サーバーに直結させてローカルHDDからデータを引き出してくるような使い方では、磁気テープドライブの速度が活きないというわけだ。

 さらに磁気テープの場合、HDDのようなランダムアクセスができないという弱点もある。そのため、単一サーバー上の大容量データのフルバックアップであればよいが、複数システムのバックアップをまとめて行ない、個別にリストアするようなケースでは特に注意が必要。村山氏は、「磁気テープはドライブの性能を活かすために異なるバックアップデータを細切れに区切り、1つのデータとして書き込み(インターリーブ)ます。しかし、リストア時に必要なデータのみ読み込もうとすると、データを読まない空走時間が長くなります。これではリストア時間がかかってしまいます」と磁気テープの弱点を指摘する。

 こうした磁気テープの課題を解決するD2Dバックアップ製品が、EMCの「Data Domainシリーズ」である。Data Domainシリーズは、D2Dバックアップ専用のストレージで、重複除外という技術により、バックアップするデータ量自体を大きく削減できるという特徴を持つ。これにより、冒頭に述べたデータ容量の増大や性能不足、あるいは運用負荷の増大といった課題を抜本的に解決することが可能になる。また、磁気テープドライブをそのままリプレースすることで、既存のバックアップソフトやデータを集約するバックアップサーバーなどをそのまま利用できるのも大きなメリットだ。「今まで習慣的にテープを使っていたユーザーが、コストや信頼性、運用負荷など課題を解決すべく、Data Domainに乗り換えるケースが増えています」(村山氏)という。

Data Domainのエントリモデル「EMC Data Domain DD160」

運用性や信頼性などData DomainのD2Dはここがメリット

 Data Domainのメリットとして挙げられるのは、なんといっても「運用の容易さ」である。これまで磁気テープは交換可能なリムーバブルメディアであることが災害対策向けと認識されてきたが、データ量が増えてくるとテープメディアを交換したり、複数のメディアを管理する作業が逆にデメリットになってしまう。特に災害時にはテープメディアを物理的に運搬する必要があり、いち早い復旧は難しくなる。これに対してD2Dバックアップでは、メディア交換は不要で、バックアップしたデータを遠隔地にレプリケーションする処理まで自動的に行なえる。また、重複除外後のデータしかネットワークに流れないため、バックアップやWAN経由のレプリケーションも短時間で済む。これが管理負荷の軽減につながるのは想像に難くない。

重複除外では一般的なバックアップ運用で1/10~1/30にデータ量を削減する

 もう1つData Domainのメリットとして大きいのは、確実にデータがバックアップ・リカバリできるという信頼性であろう。管理者にとって一番恐ろしいのは、「リストア時にデータが読めない!」ということだが、これはまま起こりうる事態だ。村山氏は、「テープは『お守り』ではありませんので、確実にデータを戻せる必要があります。そのためメディアエラーが起こることを前提にシステムが設計されていなければなりません」と語る。

 もとより、メディアを回転させてデータの読み書きを行なうというメカニカルな部分は、HDDも、磁気テープも基本的には同じだが、磁気テープには本来的な弱点がいくつかあるという。「技術革新のおかげで、磁気テープの信頼性が昔に比べて格段に上がっているのは事実です。しかし、何らかの理由でリーダーピンのずれなどが発生すると、テープメディアを正しく扱えなくなります。また、テープには機械的な機構が多く、その故障による障害も少なくありません。そもそもテープは持ち運び可能なメディアであるため、外界からホコリや湿度の影響を受けるのは避けられません」(村山氏)というわけだ。

 その点、プライマリストレージとして長らく業務データを格納してきたHDDベースのシステムでは、信頼性を確保するための技術が数多く用意されている。Data DomainではRAIDやベリファイ処理、独自のファイルシステムなどにより、つねにバックグラウンドで書き込まれたデータの整合性確認を行ない、確実にデータを読み出せるようにしているという。また、ネットワークの冗長化なども可能なので、システム全体として高い信頼性を確保できる。

何重もの保険をかけたData Domainの信頼性

 ●

 磁気テープからHDDへという流れは、まさに音楽の記録メディアの隆盛と同じだ。ほぼ20年前、汎用の録音メディアは磁気テープしか存在しておらず、その後デジタル化の流れでMDやCD-Rなどのメディアが一般化してきた。そして、PCと同じHDDでの保存が普通になり、そのHDDですらメモリオーディオに置き換えられつつある。企業におけるバックアップも、同様の変化の波が訪れていると考えられる。

 こうした中、Data DomainはD2Dバックアップにおける選択肢として筆頭に挙がる製品だ。次回は単なるD2Dバックアップ製品にとどまらないData Domainの重複除外技術について、徹底的に解説していく。

■関連サイト

カテゴリートップへ

この連載の記事
ピックアップ