スキルゼロのエンジニアが1年で運用デスマを解消した話 第2回
ソーラーウインズの「NPM」でデータセンターを救え!いや、まじで
ネットワーク管理ツールなんて10年早いは本当か?
2015年08月10日 09時00分更新
システムの運用管理に悩む中堅情シス子会社のエンジニア西牧太陽。「運用現場は戦場よ!」が口癖の妖精ウインズに出会った彼は、さっそく運用管理ツール「ネットワークパフォーマンス・モニター(略称:NPM)」の導入にコマを進め……られるのか?
しょぼいデータセンターにNPMはなぜ必要?
障害だらけのデータセンターでデスマなオペレーションを続ける西牧太陽が出会ったシステム運用の妖精ウインズ。「運用現場は戦場よ」が口癖のウインズは、どうやらソーラーウインズの「NPM」というツールを使うことで、ネットワークを見える化できるらしい。西牧は徹夜明けのリフレッシュルームで、コーヒー飲みながらウインズのアジテーションを受けていた。
ウインズ:いいこと!保守切れスイッチやスパゲッティ配線だらけのこのしょぼいデータセンターを運用するには、NPMの導入が必須よ。わかったら、早く稟議書を書きなさい!
西牧:ヒラのエンジニアにネットワーク管理ツールを導入する権限なんてないですよ。だいたいコスト的に見合うんですか?
ウインズ:わかってないわね。アメリカで生まれたNPMが、そこらへんの理論武装していないわけないじゃない! 費用対効果が高く、導入の敷居が低いのよ。
西牧:それって要は安いってこと?
ウインズ:オウ、ノー!単に安いって言ったらホントただの安物みたいでしょ!「費・用・対・効・果」が高いの。しかもアプリケーションやサーバー、仮想化環境、パッチ、ログ&イベント、ストレージなどさまざまなツールがコンポーネント化されているから、監視対象にあわせて追加できるわ。高価な全部入りからスタートじゃなく、必要な機能と監視対象の範囲で価格が決まるってことよ。
西牧:でも、結局障害対応するのは変わらないわけだから、結局夜中に電話かかってくるわけですよねえ。
ウインズ:まったく、そんなこと言ってるから、いつまでもヒラなのよ。戦いはいつでも早期警戒体制がキモなのよ。その点、NPMは障害を発見するだけじゃなく、パフォーマンスや可用性、レスポンス時間などを表示することで、障害原因を特定したり、障害の予兆となる現象をいち早くチェックできるのよ。ほかのツールを組み合わせれば、メモリやCPUがリソース不足が起こってるとか、ストレージのI/Oがボトルネックになっているとか、モバイルトラフィックがやたら多いとか、いろいろ見られるわ。障害の切り分けがいち早くできたら、あなたの寝る時間も増えるでしょ。
西牧:確かに。事後的な障害対応じゃなくて、壊れる前に障害のタネを摘んでおこうということか。なるほど。
ウインズ:そう言えば、1週間ほど前、月次処理で基幹システムのパフォーマンスがやたら落ちた時があったでしょ。
西牧:(ギクッ!!)
ウインズ:機器は古くても、不正な通信を遮断するとか、スイッチの経路を変えるとか、運用でカバーできるところもけっこうあるのよ。障害の原因を機器のせいにして、しょぼい運用していてたら、遠からず事故も起こるわよ。
西牧:でも、原因がネットワークじゃなくて、サーバーとか、ストレージとか、データベースってこともありますよ。
ウインズ:その点、ソーラーウインズのツールは単にアラートを挙げるだけじゃなくて、原因を深掘りできるのよ。まあ、その前に君の会社は管理が異常にサイロ化しているから、そこら辺を解決してからね。確かにいきなり稟議書は敷居が高いから、まずは部屋の端っこにある一昔前のサーバーをさっさと鹵獲(ろかく)して、NPMを試用してみなさい!
西牧:あっ、はい。
気のない返事をしながら、さっそく社内ラボ環境で試用してみることにした西牧。ソーラーウインズのサイトで、30日間の無料試用版をダウンロードし、一昔前のサーバーにインストールしてみた。
驚いたのは、自動ネットワーク検出とマッピングの機能があるので、SNMP対応デバイスを手動で登録する必要がないこと。1時間足らずであっという間に見える化環境が構築されてしまった。登録されている機器のディスク容量やCPU負荷、メモリ使用率、帯域幅使用率、パケットの損失、遅延、エラー、破棄、サービス品質までがダッシュボードから一目で見渡せる。これなら、数多くのデバイスがあるデータセンターでも、効率的に監視できそうだ。
(次ページ、大規模な障害が発生!ピンチはチャンス?)
この連載の記事
-
最終回
デジタル
ソーラーウインズの統合監視システムで運用は本当に変わったのか? -
第6回
デジタル
西牧とウインズ、アプリ開発部隊“19階”からの要求に応えられるのか? -
第5回
デジタル
隣のシステムはオールグリーン?サーバーだって監視したい -
第4回
デジタル
単なる障害検知じゃ意味ない!現場のエンジニアがNPMをつっこむ -
第3回
デジタル
エンジニアだらけの社内デモ!ネットワーク監視は簡単に始められる -
第1回
デジタル
現場は戦場だった!インフラ運用に配属された僕の悲劇 - この連載の一覧へ