最近では、テープに替わって個人やSOHO規模ではHDDが、エンタープライズ規模ではストレージ装置が、バックアップメディアの主流の座を占めるようになった。この変化をもたらした理由を検討し、ストレージ装置の構造や機能について解説する。
テープからHDDへ
本連載の第2回「バックアップをするには何が必要なの?」でも簡単に説明した通り、バックアップメディアといえば従来は磁気テープ(以下、テープ)が主流だった。しかし、最近ではHDDやストレージ装置を記憶媒体に用いることが多くなった。そして、目的に応じてバックアップメディアを使い分けるようになった。
すなわち、従来の「コストを考えればバックアップはテープに取るしかない」という考え方が、いまでは「ひんぱんにリカバリしたり、短時間でバックアップ/リカバリ処理を完了しなければならない場合は、バックアップをHDDやストレージ装置に取る。データを長期保管する場合や、災害に備えて安全な場所に保管する場合は、バックアップをテープに取る。」という考え方に変わってきたのである。
バックアップの理想と現実
ここで、第1回「バックアップはなぜ必要なのか? 」で説明したRPO(目標復旧時点)とRTO(目標復旧時間)を思い出してほしい。障害が発生すると、RPOから障害発生時点までの間に作成されたデータは失われる。また、障害発生時点からRTOまでの間、データの作成ができない。つまり、事業活動にとって機会損失が生じる(図1)。
機会損失を最小にするには、RTOとRPOの両方を限りなくゼロに近づける必要がある。すなわち、
- バックアップ処理が一瞬で完了する
- リカバリ処理も一瞬で完了する
- 自動的に実行され、管理者の手を煩わせない
というのが管理者の理想とするバックアップシステムである。
しかし、こうした管理者の理想は、コストの制約という現実に阻まれてきた。HDDのほうが利点の多いメディアであるにもかかわらず、これまで磁気テープがバックアップメディアの主流であった理由はコスト面での優位性にある。従来はバックアップ処理に必要な費用はいわば「かけ捨ての保険料」とみなされ、バックアップデータの単位容量あたりのコストが最低のメディアである、磁気テープが選択されてきた。
ところが、この10年ほどの間にHDDの価格が急激に下落したため、テープのコスト優位性が弱まってきた。そして、インターネットの普及など情報システムの利用環境が激変したことにより、RTOとRPOの両方を限りなくゼロに近づけることで事業上の競争優位をもたらすという認識が高まってきた。最新のバックアップを考える上で、この2つの環境の変化は非常に重要な意味を持つので、少し詳しく解説しよう。
HDDの価格低下
まず、HDDの価格の変化から説明しよう。表1は、本記事の執筆時点(2010年4月)とその10年前の2000年4月における、HDDおよびテープのコストを比較したものである。表中のHDDはPC用のATAまたはSATA接続の内蔵ドライブ、テープはサーバーのデータバックアップ用製品の、その時点で容量単価が最安値となる市販製品の価格を掲載している。
現在 (2010年4月) | 10年前 (2000年4月) | ||
---|---|---|---|
HDD | 容量/規格 | 2TB / SATA | 40GB / Ultra ATA |
市中価格 | 1万2000円 | 2万8000円 | |
1Gバイト単価:(A) | 6円 | 700円 | |
磁気テープ | 容量(非圧縮)/規格 | 800GB / LTO-4 | 12GB / DDS-3 |
市中価格 | 6400円 | 1200円 | |
1Gバイト単価:(B) | 8円 | 100円 | |
相対コスト:(A)/(B) | 0.75 | 7 |
ここでは、1GB単価の推移に注目してほしい。この10年間で、HDDの1GB単価は約100分の1に下がった(700円から6円)。一方、テープの1GB単価は100円から8円であり、約10分の1程度しか下がっていない。もちろん、実際にデータを格納するには、HDDには電源やディスクコントローラーや接続インターフェイスが必要であるし、テープにもそれらに該当するテープドライブ装置が必要である。そのため単純に「もはや1GB単価ではHDDのほうが安い!」といってしまうのは危険である。しかし、この10年間のHDDの価格下落により、テープのコスト優位性が大きく下がったことは容易に理解できるだろう。
情報システムの利用環境の変化
次に、情報システムの利用環境の変化を解説しよう。近年、企業の業務システムとインターネットが連繋するようになったため、各企業はインターネット向けサービスの強化に乗り出している。特にエンドユーザー向けのサービスでは、サービス時間が24時間ノンストップに近いほど競争優位に立てると信じられてきた。そのため、
- 定期的なバックアップ処理でオンラインサービスを停止する時間を短くする
- システム障害時のリカバリ処理の時間を可能な限り短くする
- Webフォームや電子メールなどで外部から受け取ったデータはシステム障害が発生しても消失させない
といった要求が強くなった。
その一方で企業の保有するデータは肥大化しており、従来のように「定期的にオンラインサービスを停止してテープにデータを吸い上げる・障害時にはシステムを停止してテープからデータを書き戻す」というバックアップ/リカバリ手法では要求に応えられなくなってきた。
テープは大容量データを連続的に格納するには最適なメディアだが、電子メールなど細分化された小さなファイルのバックアップ/リカバリには適さない。特に、リカバリ処理でその欠点が顕著である。対象のデータがテープの中ほどにバックアップされている場合、テープを探し出してドライブ装置に装着し、目的とするデータにたどり付くまでテープを走査してから、必要なファイルを読み取らなければならない。
一方、HDDはランダムアクセスが可能なので、このようなデータであっても瞬時に読み出すことができる。バックアップ処理においても、HDDはテープよりも書き込み速度が速いため、上記の3つの要求に対して、バックアップメディアとしてテープよりも全面的に優位にある。
すなわち、「管理者の理想とする究極のバックアップシステム」を実現するには、テープよりもHDDをメディアに使ったほうがよい。そして、大規模なシステムでは、このような特性をもつHDDを大量に搭載したストレージ装置を、バックアップメディアとして活用するようになった。
(次ページ、「ストレージ装置とは」に続く)
この連載の記事
-
最終回
データセンター
バックアップを賢く行なうための設定チェック -
第11回
データセンター
シンプルなバックアップを試してみる -
第10回
データセンター
ホストから始まったバックアップの歴史を振り返る -
第9回
データセンター
サーバー仮想化環境では、どうバックアップする? -
第8回
データセンター
データを長期間安全に保護するアーカイブとは? -
第7回
データセンター
災害対策のためのバックアップを知ろう -
第6回
データセンター
ディスクバックアップを支える新しい技術とは? -
第4回
データセンター
バックアップに使うメディアはどう選ぶ? -
第3回
データセンター
フルバックアップと増分バックアップは何が違う? -
第2回
サーバー・ストレージ
バックアップをするには何が必要なの? - この連載の一覧へ