このページの本文へ

Linuxとフォールトトレランス

2001年03月13日 00時00分更新

文● テンアートニ 佐藤栄一

  • この記事をはてなブックマークに追加
  • 本文印刷

長い間PCサーバによるシステム構築に携わるとさまざまな場面に遭遇します。特に印象深く教訓として残るのは、障害の場面です。どんなに信頼性が向上しても、所詮機器なので、ある程度障害が発生します。もちろん事前の備えによって、トラブルを最小限の被害で乗り切った例も数多くあります。しかし、教訓として脳裏に強く焼きつくのは、最悪のケースのほうが多いでしょう。

たとえば、RAIDが仇になった例です。

もう、10年ほど前のことです。当時は、RAIDではなく、Novellのミラーディスク(現行のRAID)で運用していたサーバがありました。あるとき、「サーバがダウンした」と呼ばれ、実際にサーバを調査するとディスクがまったく見えない状況となっていました。ログを調べて愕然としました。2つのディスクのうち、片側のディスクが1カ月から停止しているのです。システム管理者が気が付かなかったので、そのまま運用が続き、今回の障害によって残ったディスクまでもが停止したのです。つまり、1カ月前から片肺(2重化しているディスクの1台のみ)で運用していたわけです。いくらRAIDを導入しても、障害が起こった際に対応しておかないと、もう対応できないのです。このときは、1カ月前に停止したほうのディスクが復旧できたので、1カ月分のデータが消滅しただけで、最悪の事態を回避できました。

電源はコンピュータにとって、まさしく“源”です。UPSは、手軽な解決策をもたらします。その機構も単純で、車で使用している鉛バッテリを使用して一時的に電源を供給します。バッテリは消耗品なので、定期的に交換が必要です。車でも2年前後でバッテリを交換します。交換を怠ると、充電容量が低下して電源供給時間が短くなります。3年程度バッテリを交換していないUPSの電源供給時間を計ってみると、数秒です。これでは、シャットダウンする間もなく停止してしまいます。また、一度フル放電してしまうと、蓄電容量が半分になってしまうので要注意です。

磁気テープは、バックアップメディアに使用することが多い装置です。よく、テープを交換しないで使用している場合があります。これは、テープをケチっているのではなく、交換するのが面倒なので、マウントした状態で1本のテープを連続利用してしまうためです。

あるお客様の定期点検で、バックアップログを見ると毎日エラーが発生しています。毎晩自動的に実行するバックアップ処理がエラーとなっているのです。つまり、まったくバックアップが取れていなかったのです。毎日、新規テープとして同じテープでバックアップを取っていたのが原因でした。

このように、フォルトトレーラントの目的でいろいろな対策を講じても、それを有効に利用するには「使用上の注意」を守らなくてはなりません。しかも、Linuxシステムを見ると、RAID、UPS、バックアップ装置の導入が少ないように思えます。Linuxが普及し、Linuxシステムへの依存度が高くなることを考えると、このような基本的なフォルトトレーラントは、重要な意味を持っているはずです。

カテゴリートップへ

ピックアップ