遠隔地で同期するリモートレプリケーション
最新の遠隔バックアップ技術は、上に述べたレプリケーションを、遠く離れた地点に設置された2つの装置間で行なう「リモートレプリケーション」である。
リモートレプリケーションの実装には、
- Oracleなどのデータベースアプリケーションの機能として動作させる
- サーバーのバックアップソフトやミドルウェアの機能として動作させる
- ストレージ装置の機能として動作させる
の3種類がある。災害対策を考えた場合、データベース以外にもバックアップの必要なデータがあるため、バックアップソフトかストレージ装置の機能を用いる。比較的小規模なシステムでストレージ装置を利用しない場合は、バックアップソフトを用いることになるだろう。
リモートレプリケーションには、同期モードおよび非同期モードという2種類の動作がある(図3)。

図3 リモートレプリケーションの同期モードと非同期モード
同期モードでは、ローカル側への書き込み要求(ディスクやストレージ装置へのI/O)は、リモートへの転送とリモート側の更新が完了してから、要求元のアプリケーションやサーバーへ処理の完了が通知される。同期モードでは、ローカルとリモートのデータは完全に一致するが、拠点間の距離が長くなるほど回線の伝送遅延が大きくなり、システム全体として動作が遅くなる。そのため、WANを介したリモートレプリケーションでは、同期モードを利用することは稀で、ほとんどの場合は非同期モードを利用する。
非同期モードは、ローカル側の更新処理が完了すれば、要求元のアプリケーションやサーバーへ処理の完了が通知される。このため、通信回線の伝送遅延の影響を受けずに済み、動作は遅くならないが、伝送遅延の分だけローカル側とリモート側との間でデータ更新の「時差」が生じる。そのため、回線障害が発生すれば、ローカル側とリモート側のデータが一致せず、不整合な状態になる。とはいえ、前述の通り、データセンターとバックアップサイトとの距離は、遠くなるほど災害対策としては有効なので、事実上、非同期モードしか選択肢はない。
データ量を削減する技術
事業継続のために必要な業務データには、電子ファイリングシステムやグループウェアなどに蓄積された非定型文書も含まれる。これらのデータは、基幹業務システムのデータと比べて重複が多い。同一のデータが複数セット保管されていたり、また、宛名や配布先などのヘッダー部だけを書き換えた文書が多数あったりする。これらの重複したデータを繰り返しバックアップするのは、媒体や通信回線の無駄遣いといえる。そこで、「重複排除(De-duplication)」の技法が考案された。
歴史の古い「データ圧縮」も、重複排除の一種といえる。典型的なデータ圧縮の方法は、1つのファイルの中で「繰り返し出現するビット列(データパターン)」をより短いシンボルに変換して記録するというもので、これによりメディアに書き込むデータ量を削減する。また、「ファイル単位の重複排除」も、非定型文書の保管にあたりデータ量を圧縮するために有効である。
最新の重複排除の技法は「ブロック単位での重複排除」である。これは、1つのファイルを数KBから数十KB程度の細かいブロックに分割して、ブロック単位で重複したデータを保存しないようにする技法である。表紙に配布先名を埋め込んだパワーポイントのプレゼンテーション資料が大量に保管された場合を考えてみよう。表紙以外はまったく内容が共通したファイルなので、ファイル単位の重複排除に比べてブロック単位の重複排除の効果は非常に大きくなる(図4)。

図4 重複排除の仕組み
「ブロック単位での重複排除」は、高機能なバックアップソフトやストレージ装置、およびWAN高速化装置などに組み込まれている。これらの機能をもつソフトや装置を使えば、バックアップ媒体の容量をより小さくしたり、より低速な回線で遠隔バックアップしたりすることが可能になり、ランニングコストを下げることができる。

この連載の記事
- 第5回 iStorage HSで実現する失敗しない遠隔バックアップ
- 第4回 こんなにお手軽!Barracuda Backup ServicesがDRを変える
- 第2回 事業継続の要「業務データ」を地震や津波から守るには
- 第1回 東日本大震災で見直される災害対策
- 大震災以降のITの災害対策を考える
- この連載の一覧へ