近年、コンプライアンスやコーポレートガバナンスの制度がわが国にも導入され、これらの課題に対応するため、企業の保有する電子データを安全に、かつ長期的に保存する「アーカイブ」に注目が集まっている。今回は、このアーカイブについて説明する。
そもそもアーカイブとは?
わが国でも、製造物責任法(PL法)や金融商品取引法(J-SOX法)などの施行により、事業活動に関する情報を長期に渡り保存する義務が、企業に課せられるようになった。すなわち、大量の電子データを、適正なコストで、安全かつ長期的に保存する仕組みが必要とされている。こうして長期保存されるデータの集まりを「アーカイブ(Archive)」、長期保存のために行なわれる作業も「アーカイブ」または「アーカイビング(Archiving)」という。
もともと、「アーカイブ」という言葉は「収蔵庫」とか「保存庫」を意味する。象徴的には東大寺の正倉院を思い浮かべてもらえばよいだろう。重要な文物を長期に渡り保存し、必要になった場合には容易に取り出せるという機能をもった建造物である。ITの世界では、「重要な文物」がデジタルデータに置き換えられ、IT用語としてのアーカイブは、「消してはいけないデータを、長期保存に適した媒体(メディア)へ安全に保存したもの」、あるいは「安全に保存すること」となる。
企業のシステムでアーカイブされるデータの代表は、年次決算のデータである。多くの企業で、事業年度の期末時点での会計システムのバックアップデータは、定期的に行なわれる税務調査などに備えて半永久的に保存されている。
従来、アーカイブはバックアップの延長と考えられており、アーカイブに利用される媒体は、ほとんどが磁気テープであった。年次決算のバックアップデータが書き込まれたしたテープは、データセンターに一定期間(1月~1年ほど)保存されたあと、外部の倉庫に搬送して半永久的に保存された。図1はそのようなアーカイブ処理のフローの例である。
アーカイブとバックアップの違い
アーカイブとバックアップはきわめて関連性が高いが、同時に、似て非なるものでもある。アーカイブの第一の目的はデータの長期保存であるが、バックアップは障害時にシステムを回復するためのデータ保存が目的である。そのほか、アーカイブとバックアップの違いをまとめたのが表1である。
アーカイブ | バックアップ | |
---|---|---|
主目的 | データの長期保管 | 障害時のデータ回復 |
その他の用途 | コンプライアンス対応 | 災害対策、テストデータへの転用 |
データの有効期間 | 比較的長期(数ヶ月~十年以上) | 比較的短期(数日間~数ヶ月) |
データ形式 | コンピュータの内部形式、業界標準形式、帳票イメージ | コンピュータの内部形式 |
対象データ | ほとんどの場合、ユーザデータだけ | OSやアプリケーションも含む |
オリジナルデータの削除 | アーカイブ実施後に行うことがある | 行わない |
WORM媒体の使用 | あり | なし |
表中のWORMは、「Write Once, Read Many」の略で、データの書き込みが一度しかできない媒体だ。書き込まれたデータの書き換えや削除はできないが、読み出しは何回でもできる。主として改ざんの防止のため使われるものである。
アーカイブでは、データを十年以上に渡り保存しなければならない場合がある。建築物の設計図面や仕様書などは、その建築物が取り壊されるまで保存されるのがあたり前で、保存期間は数十年にものぼる可能性がある。
このような場合、従来は紙のほかマイクロフィルムを使って長期保存してきた。今後は電子データによるアーカイブが主流になっていくと思われるが、アーカイブされたデータを読み出すために専用アプリケーションが必要な場合、そのアプリケーションが長期に渡りサポートされるかどうかが重要となる。
そのため、コンピュータの内部形式のまま保存するのではなく、CSVやXMLなどの業界標準のフォーマットに変換して保存することがある。同様の理由で、たとえば会計システムの出力帳票のイメージをBMPやTIFFなど画像データに変換してアーカイブすることもある。最近では、PDF形式でのアーカイブも広く利用されている。
一方、同じシステムへリストアすることを目的とするバックアップでは、コンピュータの内部形式で保存する。保存する期間が比較的短い場合や、アプリケーションが長期に渡りサポートされるのが確実な場合は、アーカイブであってもコンピュータの内部形式で保存する。
(次ページ、「コンプライアンス目的のアーカイブ 」に続く)
この連載の記事
-
最終回
データセンター
バックアップを賢く行なうための設定チェック -
第11回
データセンター
シンプルなバックアップを試してみる -
第10回
データセンター
ホストから始まったバックアップの歴史を振り返る -
第9回
データセンター
サーバー仮想化環境では、どうバックアップする? -
第7回
データセンター
災害対策のためのバックアップを知ろう -
第6回
データセンター
ディスクバックアップを支える新しい技術とは? -
第5回
データセンター
バックアップメディアはテープからHDDへ -
第4回
データセンター
バックアップに使うメディアはどう選ぶ? -
第3回
データセンター
フルバックアップと増分バックアップは何が違う? -
第2回
サーバー・ストレージ
バックアップをするには何が必要なの? - この連載の一覧へ