このページの本文へ

前へ 1 2 3 次へ

サーバトラブル解決のセオリー 第6回

障害が発生した場合に迅速に対応できる体制作りが大切

RAIDのエラー対策をしていますか?

2009年07月31日 09時00分更新

文● のりぞう

  • この記事をはてなブックマークに追加
  • 本文印刷

リビルド中のパフォーマンス低下

 ディスク障害が発生した状態でサービスを継続する場合、RAID 1ではディスクのアクセス性能はほとんど低下しないが(読み出しをストライピングする賢い製品では低下する)、RAID 5/6ではアクセス性能が低下する。

 また、いずれのRAIDレベルを利用していても、ディスクを交換したあとのリビルド(RAIDの再構築)時にはアクセス性能がかなり低下する。現在一般的に使われている数百GB~1TBクラスのディスクドライブでは、リビルドにはかなりの時間を要する。場合によっては1日程度要することもあるだろう。よって、その状態でサービスの提供を継続できるかどうかを検証しておきたい。負荷が高くユーザーへのサービスの提供が困難である場合は、一時的にサービスを停めるか、リビルド時にもサービスを提供し続けられる機材に交換するなどの代替策を考えなければならないだろう。

試験運用時の予行演習と障害対応マニュアルの整備

 RAIDを構成するディスクドライブの障害対応を円滑に行なうためには、障害が起きる前に確認しておくべき事柄が多い。実運用を開始する前に、ディスクドライブを減らすなどして人為的にディスク内容の不整合を発生させ、障害対応の予行演習を実施しておこう。もちろん、それを基に作業マニュアルを整備しておくことが重要だ。予行演習での確認事項と、作業マニュアルの整備については図1、2を参照のこと。

図1 予行演習での確認事項

図2 対応マニュアルの整備

前へ 1 2 3 次へ

カテゴリートップへ

この連載の記事