このページの本文へ

前へ 1 2 次へ

ゼロからはじめるバックアップ入門 第8回

バックアップとは異なる用途のデータ保存を知ろう

データを長期間安全に保護するアーカイブとは?

2010年07月29日 09時00分更新

文● 伊藤玄蕃

  • この記事をはてなブックマークに追加
  • 本文印刷

コンプライアンス目的のアーカイブ

 コンプライアンス(法令遵守)やコーポレートガバナンス(企業統治)のためのアーカイブは、企業活動を監視・統制するために行なわれる。アーカイブされたデータは、法令や社内規則に反する不正行為が行なわれていないかどうかを、事後的に検証するために利用される。利用するのは、内部監査部門や法務部門や検査部門などの社内の組織だけでなく、企業の所管省庁や地方公共団体(自治体)などの外部の公的機関の場合もある。つまり、コンプライアンス目的のアーカイブは、究極的には「証拠の保全」を目的としているのだ。

 よく知られた例としては、「インサイダー取引の監視のためのデータの保存」がある。これは、証券取引等監視委員会が、証券取引所や証券会社に対しすべての株式の取引データを一定期間保存することを義務付けたものである。これを受けて、証券取引所や証券会社は株式の取引データをアーカイブしている。そして、証券取引等監視委員会は「インサイダー取引があった可能性が高い」と判断したら、ある銘柄のある期間の取引データを証券取引所や証券会社からすべて取り寄せて、その内容を精査して、本当にインサイダー取引があったのかどうかを捜査する。

 製造物責任法(PL法)や金融商品取引法(J-SOX法)でも、当局からの要求があれば、製造データや会計データなどを提出しなければならない。ここで、アーカイブされたデータは、「確実な証拠」であることが要求されるため、今後は次のような条件を満たす必要があるだろう。

  1. 完全性:完全な状態であり、内容が改ざんされたり、損傷する可能性がない
  2. 機密性:アクセスできるユーザーが限定され、権限が正しく管理されている
  3. 確実性:電子署名などの技術により、①・②を客観的に証明できる
  4. 可読性:外部への開示を考慮し、汎用的なツールで読み出せる

 コンプライアンス目的のアーカイブでは、電子署名・暗号化技術を採用したアーカイブ専用のソフトウェアを利用するのが一般的である。また、WORM(Write Once Read Many)メディアを利用することで、完全性を容易に実現できる。WORMメディアには、磁気テープ(LTOやAITなど)や光学ディスク(CD-R・DVD-Rなど)がある(写真1)。

LTO Ultrium テープカートリッジは、第3世代からWORMに対応している。写真はイメーションの第5世代の製品

 最近では、アーカイブの対象となるデータが大量になるにつれて、情報検索の高速性や利便性が求められるようになってきた。単にデータを長期保管するだけでなく、必要な時に必要なデータをすぐに検索し、短時間で取リ出すことが必須なのである。ここで、磁気テープはランダムアクセスに対応できない・光学メディアは容量が小さくアクセス速度も遅いという点が問題となる。

 そこで、WORM(Write Once Read Many)メディアへのアーカイブとは別に、比較的コストパフォーマンスのよいNASなどのストレージ装置にデータをアーカイブして、全文検索のインデックスを付けるといった対応が多く見られるようになった。また、管理ソフトウェアの機能により、WORM機能を付加できるストレージ装置も出てきた。

ストレージ有効活用のためのアーカイブ

 バックアップの1次媒体としてストレージ装置が主流になるにつれ、容量あたり単価の高いストレージ装置の有効活用が叫ばれるようになった。すなわち、「情報の価値が小さいデータのために高価なストレージ装置を使うのはもったいない」、「特にそういったデータのバックアップでは、ストレージ装置は避けよう」という話である。

 一般に、情報は新しいものほど価値が大きくアクセス頻度も高く、古いものほど価値は小さくアクセス頻度も低くなる。そこで、アクセス頻度の低いデータ(非活性データ)を、通常運用のための高性能で高価なストレージ(プライマリストレージ)から、性能は低いがコストも安いストレージ(セカンダリストレージ)へ移動することが行なわれるようになった(図2)。

図2 ストレージ有効活用のためのアーカイブ

 これにより、高価なプライマリストレージには、価値の大きなアクセス頻度の高い、「旬のデータ(活性データ)」だけが残った状態になる。この処理もまた、「データを保存庫へ移す」という意味でアーカイブの一種である。

 HDDやストレージ装置へアーカイブを行なう場合には、アーカイブした非活性データについても定期的に磁気テープなどへバックアップする必要がある。アーカイブとバックアップとを混同して、「アーカイブしたデータのバックアップは不要」と考えてはならない。ストレージ有効利用のためのアーカイブでは、アーカイブされた非活性データをプライマリストレージから消すことになるので、セカンダリストレージのバックアップも必須である。

 とはいえ、一般に非活性データは、更新されず参照されるだけとなることが多い。すなわち、ひんぱんにフルバックアップを行なう必要はないし、差分・増分バックアップを行なっても対象となるデータがないことが多い。

 そこで、非活性データを月次でセカンダリストレージへアーカイブする場合、セカンダリストレージのフルバックアップはアーカイブ処理の直後の月1回だけにして、あとは増分バックアップを週次で行なうことが可能になる。このようにして、平日のバックアップの対象とするデータをプライマリストレージに格納された活性データだけに絞り込めば、日々のバックアップ時間や障害時のRTO(目標復旧時間)を短縮できるのだ(図3)。

図3 アーカイブによるバックアップ対象データの減少

前へ 1 2 次へ

カテゴリートップへ

この連載の記事