このページの本文へ

前へ 1 2 次へ

ゼロからはじめるストレージ入門第2回

データを保護する技術とは?

ハードディスクとRAIDの基礎を学ぼう

2009年09月04日 09時00分更新

文● 吉田尚壮/EMCジャパン株式会社 グローバル・サービス統括本部 テクノロジー・ソリューションズ本部 技術部 テクノロジー・コンサルタント

  • この記事をはてなブックマークに追加
  • 本文印刷

ディスクアレイのデータを保護する技術

 次に、ストレージアレイやサーバがHDDを実装する形態や、ディスク故障に対するデータ保護の仕組みについて見てみよう。ストレージアレイやサーバが、単純に複数のHDDを連結させて大容量化を実現する方法をJBOD(Just a Bunch Of Disks)またはスパニング(Spanning)と呼んでいる。JBODは、専用のコントローラやソフトウエアでHDDを制御し、複数のHDDを連結させて、記憶容量を1つにまとめて利用できるようにする技術である。たとえば、1TBの記憶容量を持つHDD10台をJBODで連結すると、サーバからは10TBの記憶領域として認識されるのである。

図3 JBODの構成概念図

 一方、JBODはデータの冗長機能や修復機能などが備わっていないので、HDD故障に弱い。JBODは、複数の物理HDDを論理的に1つの記憶領域として構成するため、1台でもディスクが故障してしまうと、構成情報の整合性が失われ、アクセスができなくなってしまうのである。当然ながら、故障したディスクを単純に交換しても、データは復旧しない。

耐障害性に優れたRAID技術

 JBODの耐障害性が低いという致命的な問題を解決するために開発された技術が、RAID(Redundant Arrays of Independent Disks)だ。RAIDは、1988年に発表されて以来、多くの記憶装置やサーバで採用され、大規模な企業のシステム環境を中心に普及が進んだ。RAIDは、専用のRAIDコントローラ(ハードウエア)やソフトウエアでHDDを制御する構成となっているが、現在市販されているストレージアレイには、予めRAIDコントローラが実装されている。

 RAIDは、複数のHDDを論理的な1台のディスクとして連動させるだけではなく、HDD故障においてもデータを再構成して復元させる機能や、データを二重化して保持する仕組み、およびデータを複数のディスクへ分散させて読み書きの性能を高める仕組みを持つ。

 なお、RAIDにはいくつかのタイプ(種類)があり、ユーザーの要件に合わせて選択できる。現在、おもに利用されているRAIDタイプを以下に列挙しよう。

RAID 0

 RAID 0は、「ストライピング」とも呼ばれている。データは、「ブロック」という一定のサイズに分割され、2台のHDDに分散して書き込まれる構成となっている。したがって、RAID 0 は2台のディスクで単一ディスクと認識される。また、データが完全に2台のディスクに分散しているため、1台の物理ディスクが故障すると整合性が失われ、全体のデータ消失となる。耐障害性という観点では、他のRAIDタイプの中でもっとも低い。このことからも、RAID 0は高可用性のためではなく、おもに高速化を目的として利用されている。

図4 RAID 0 の構成概念図

同じ内容を2ドライブに書き込むRAID 1

 RAID 1は、「ミラーリング」とも呼ばれており、2台のディスクへ同一の内容を同時に書き込む構成である。1台の物理ディスクが故障しても、もう1方のディスクのデータがすぐに利用できるため、データの損失を阻止できる。

図5 RAID 1 の構成概念図

2つの技術を組み合わせるRAID 1+0

 RAID 1+0は、RAID 1でミラーリングしたディスクグループをRAID 0でストライピングした構成である、RAID 1による高可用性と、RAID 0による高速化を同時に実現する構成である。データは、ミラーリングされた2台のディスクに書き込まれ、他のミラーリングされた2台のディスクへストライピングされる。RAID1+0は、最低4台のディスクから構成可能であり、最高 2 台の物理ディスクが故障してもデータの損失は防げる(ただし、同一ミラーディスクではないことが条件)。

図6 RAID 1+0の構成概念図

パリティデータを書き込むRAID 5

 RAID 5は、最低3台のディスクを用いて、ストライプされて書き込まれるデータセットに対するパリティデータ(訂正符号データ)を付加して分散保存する構成である。1台のディスクが故障した場合、保存されているパリティデータから消失したデータを復元(リビルド)させることできる。

図7 RAID 5の構成概念図

 まず、パリティデータについて説明しよう。RAID 5を3台のディスクで構成する場合、データはブロック単位で2台のディスクに書き込まれる。この時、3台目のディスクには、2台のディスクに書き込まれたデータから「排他的論理和」という論理演算で計算した結果をパリティデータとして書き込まれる。さらに、このパリティデータを各ディスクに分散して書き込むことで負荷を分散させ、耐障害性も高めている。

 このように、パリティデータを利用することで、RAID 5は1台のディスクが故障してもデータ消失には至らずアクセスは継続されるのだが、ディスク故障中に失われたデータへアクセスする場合、再計算してデータを復元する処理が都度実行されるため、一時的に性能が低下してしまう。また、1台のディスク故障中に2台目のディスクが故障すれば、復元が不可能となりすべてのデータが失われてしまう。

より安全性の高いRAID 6

 RAID 6は、1つのデータセットに対して2つのパリティを計算し、2台のディスクに分散保持する構成である。これで、物理ディスクが同時に2台故障しても、アクセスが継続されデータの復元が可能となる。HDDの大容量化が進むにつれて、RAID 5構成では1台のHDD故障した場合、リビルド時間が長時間に及ぶために、その間に2台目のHDDが故障してデータ消失の可能性が高くなる。その点においてRAID 6は、各RAIDタイプの中で最高の可用性を提供できる。

図8 RAID 6の構成概念図

ホットスワップとホットスペアによるストレージ運用の効率化

 今回紹介したRAID構成において、RAID 0以外では1台のHDDが故障しても故障したディスクを新しいディスクに交換すれば、パリティデータから失われたすべてのデータを新しいディスクに復元させることができる。この復元処理を「リビルド」という。

 RAIDのリビルド機能は、HDD故障時においてもサービスを継続できるという点で非常に有効な機能ではあるが、同じようにストレージアレイ装置側でHDDのオンライン交換を実現させるホットスワップ(活性挿抜)機能も実装されていることが望ましい。もし、ホットスワップに対応していない場合、ディスク故障のたびにストレージアレイの停止が避けられず、社内業務活動への影響も大きくなってしまう。

 また、RAIDとホットスペアディスク(代替HDD)を組み合わせると、ディスク故障が発生した際、自動的にホットスペアディスクに対してリビルドが実行され、正常な状態に戻すことが可能となる。ホットスペアディスクは、RAIDで構成されたHDDと同様に予めストレージ装置に搭載しておく予備のディスクであり、サービス継続性の維持と運用管理の負担を軽減する上で非常に有効な手段である。

 企業の業務活動を安定的に継続させるためには、ストレージアレイがホットスペアやホットスワップ機能を実装していることは非常に重要である。ストレージアレイの製品選定を行なう際には、ぜひこの点にも注意していただきたい。

図9 ホットスペアディスクとリビルド処理

 今回は、HDDの概要およびJBODとRAIDという2種類のHDD利用形態について紹介した。比較的安価なストレージアレイ製品は、JBODやRAID技術だけが採用されているケースが多い。それ故に、コントローラの故障や接続経路に問題が発生するとデータアクセスが停止してしまい、十分な冗長性や可用性を確保しているとは言い難い。次回は、企業の情報システム環境における要件や課題などに焦点をあてて、企業向けストレージに必要な条件などを解説しよう。

前へ 1 2 次へ

カテゴリートップへ

この連載の記事
ピックアップ