スキルゼロのエンジニアが1年で運用デスマを解消した話 第5回
アプリケーションまで見られるSAMの実力とは?
隣のシステムはオールグリーン?サーバーだって監視したい
2015年12月29日 07時00分更新
タフな検証と社内プレゼンを終え、データセンターの妖精ウインズとともに「ネットワークパフォーマンス・モニター(以下、NPM)」の導入までこぎつけた西牧。しかし、導入効果を得られたインフラ部隊にアプリケーション部隊からタフな依頼がやってきた。
これまでのあらすじ
システムの運用管理に悩む中堅情シス子会社に所属するエンジニアである西牧太陽。データセンターで「運用現場は戦場よ!」が口癖の妖精ウインズに出会い、ネットワーク管理ツール「ネットワークパフォーマンス・モニター(NPM)」の導入によるシステム運用の効率化を図る。上司である八尋課長の協力のもと、タフな検証と社内プレゼンを経て、NPM導入に至ったが……。
サーバーチームが「サム、サム」言い出した(笑)
西牧による地道な検証と渾身のプレゼンにより、社内のインフラエンジニアがNPMを試用し始めて2ヶ月。システム運用の効率化を訴える八尋課長の根回しもあり、社内で稟議が通り、正式にNPMの導入が決定した。深夜のデータセンターの打ち合わせルームで、ささやかながら打ち上げをやっている西牧と妖精ウインズの会話をのぞいてみよう。
西牧:いやあ、ようやく導入にまでこぎつけました。これもNPMについていろいろ教えてくれたウインズさんのおかげですよ。ありがとうございます!
ウインズ:西牧もなかなかのもんだったわ。私も、ほかのデータセンターにちょくちょく行っているけど、ここまでスピーディに導入が決まったところはあまりないわ。結局、トップよりも現場がいやがるケースが多くて、「先輩の作ったスクリプトに慣れてるんですー」とか、「MRTGから離れられないんですー」とか泣き言言うのよね。システム運用の現場は戦場なんだから、兵器(ツール)の近代化がなければ、頻発するトラブルに勝てるわけがないのよ。いつまで竹ヤリだけで戦うつもりなのかしら。で、現場は変わったの?
西牧:はい! なにしろデータセンター内のネットワーク機器がきちんと可視化されたので、単に機器の障害をいち早く知るだけではなく、エンジニアがトラブルシューティングに必要な情報を集められるようになったんです。だから、エンドユーザーから電話がかかってきても、行き当たりばったりの対応ではなく、現状と対応策をきちんと説明できるようになりました。
ウインズ:システムが障害起こすと、SNMPのトラップよりも先に、エンドユーザーから電話がかかってくるってやつね。
西牧:はい。あと、ネットワークの性能が監視できるようになったので、スピードが遅い気がするといった漠然とした問い合わせに対しても、きちんとデータが提出できるようになりました。あと、面白いのは、サーバー管理のチームもソーラーウインズのツールを検討し始めたところです。ネットワークチームのオペレーションが効率化し、定時で上がれる人が増えたのを見たらしく、先日サーバーチームの人に聞かれたんですよ。
ウインズ:「隣のシステムはオールグリーンに見える」ってやつね。実は、こっそりソーラーウインズのDMの宛先にサーバーチームも追加しておいたのよ。きっと「Server & Application Monitor(SAM)」の製品を検討しているんだわ。
西牧:そんな裏工作までやってるんですか!サーバーチームが「サム、サム」言っていたのはそれかあ。サム・クックかと思った。
ウインズ:現在は情報戦の時代よ。それにしても西牧、趣味が渋すぎだわ(笑)。SAMを使えば、エージェントレスで各種サーバーOSだけでなく、IIS、SQL Server、Exchangeなどなど、さまざまなアプリケーションのパフォーマンスまで監視できるのよ。レポート作成から、アラート、資産管理の機能まで含まれているから、どう考えてもコストパフォーマンス最高だわ。そもそもサーバーチームも台数増えて、しかも仮想化されて構成が複雑になってるから、管理がアップアップなのよ。
西牧:アプリケーションごとのパフォーマンスか。確かにサーバー管理といっても、トラブルの連絡って結局はアプリケーションを使ってるユーザーからくるものですからね。
ウインズ:インフラエンジニアがアプリごとに固有のパフォーマンス問題まで抑えるのは大変だけど、このツールがあれば、最初から情報を整理して、どのサーバーのどのアプリが、どのサービスで問題を起こしているかまで見せてくれるわ。ここまで切り分けられれば、問題対応のレスポンスも格段に速くなるってわけ。
西牧:サーバーチームまで見える化してくれると、データセンター全体で運用効率上がるなあ。
ウインズ:効率化しすぎて、あなたたちの仕事がなくならないよう、いまのうちにスキル上げておくことね(笑)。
ということで、ウインズのステルス……もとい効果的なマーケティング活動のおかげもあり、サーバーチームもソーラーウインズのSAMの導入を進めることになる。これでネットワーク、コンピューターあわせてソーラーウインズで可視化できる環境が整った。
アプリケーション部隊からの要望で統合基盤の整備へ
さて、ソーラーウインズの各種ツールによって、デスマから開放されつつある運用チームに大きな難題が降りかかった。上司である八尋課長から持ちかけられた難題は、統合クラウド基盤の構築だった。
西牧:ウインズさーん!大変ですう。
ウインズ:西牧どうした? 最近、World of Tanksにはまっているのよ。でも、稜線射撃がなかなかうまくいかない。エイッ!
西牧:最近、私も9.0にバージョンアップしたんですが、ビジュアルの美しさがすごいことになっていますよね。僕としては、攻撃に特化したドイツの駆逐戦車系がオススメです。ティアも上がっているので、もうすぐ重戦車がぶち抜けるレベルまで行けるんだけどなあ。
ウインズ:なんか相談があったんじゃないの?
西牧:そ、そうだ(汗)。八尋課長からさっき相談が来て、“19階”から来年度の上半期までで統合クラウド基盤環境を整備しろというオーダーが来たというんです。
ウインズ:その“19階”というのはなんなの?
西牧:そうだ、社内用語だ……。“19階”というのは、うちの外販部隊の中でアプリケーション開発を手がけている部署です。親会社のシステム運用は例年コスト削減を要求されているのですが、外販部隊のアプリケーション開発チームはうちの稼ぎ頭になりつつあります。だから、社内の精鋭が集まっているエリート部隊で、親会社も社長も19階の意向は基本無視できないんですよ。
ウインズ:なるほど。エース・パイロット集団というわけね。
西牧:われわれインフラ部隊は、以前からトラブルが多くて、“19階”から目の敵にされているんです。最近はソーラーウインズのおかげで、トラブルシューティングや運用の効率化が目に見えて早くなったので、社内からも評価されるようになってきたんです。でも、“19階”の連中は「インフラが落ちないのは当たり前だ」と思っているらしくて、面白くないようです。「だったらインフラのデプロイをもっと迅速にやれよ」ということで、こんな要求が出てきたんじゃないかな。しかも僕がプロジェクトリーダーやれだって!そんなこと無理ですよー。
ウインズ:まったく、アプリケーション開発チームとインフラチームの仲が悪いという話は、本当にどのSIerでも聞く話よね。まあ、いいわ。ソーラーウインズなら、仮想化環境もきっちり可視化できるから、監視体制を構築すればいいじゃん。社運プロジェクトなら、予算もある程度とれるんでしょう。
西牧:はあ、けっこうな予算が用意されていますが、納期が厳しいなあ。
ウインズ:安心しなさい! 地獄の沙汰も金次第よ。米国のベストプラクティス事例をテキサス本社に問い合わせてあげるから。西牧は、チームのメンバーにまずは相談しなさい!
西牧:お願いしますう。
ということで、インフラ環境のプライベートクラウド化に取り組むことになった西牧とウインズ。インフラチームの心を1つにし、アプリケーション部隊の要求にあったインフラを構築できるのか?
(提供:ソーラーウインズ)
この連載の記事
-
最終回
デジタル
ソーラーウインズの統合監視システムで運用は本当に変わったのか? -
第6回
デジタル
西牧とウインズ、アプリ開発部隊“19階”からの要求に応えられるのか? -
第4回
デジタル
単なる障害検知じゃ意味ない!現場のエンジニアがNPMをつっこむ -
第3回
デジタル
エンジニアだらけの社内デモ!ネットワーク監視は簡単に始められる -
第2回
デジタル
ネットワーク管理ツールなんて10年早いは本当か? -
第1回
デジタル
現場は戦場だった!インフラ運用に配属された僕の悲劇 - この連載の一覧へ