「見える」からわかる!システム障害の原因をあぶり出すテク 第6回
アプリに関連するコンポーネントスタックを“串刺し”で表示、一目で原因が「見える」ツール
アプリ障害の原因はインフラのどこに?「AppStack」が簡単解決
2016年03月01日 08時00分更新
アプリケーション障害の根本原因をAppStack上で追ってみよう
それでは、AppStackを使ってアプリケーション障害の根本原因がどこにあるのか、探してみる例を示そう。
AppStackの「アプリケーション」項目で、「重大な障害」が表示されているアプリケーションにカーソルを当ててみる。これはSQL Serverのインスタンスのようだ。サーバーマシンは問題なく稼働しているが、データベースのリード処理に遅延が発生していることがわかる。
このアイコンをシングルクリックして、画面をスクロールしていくと、関連する「LUN」コンポーネントも「重大な障害」アイコンになっている。カーソルを当ててみると、大きなレイテンシが発生しているようだ。
さらに下にスクロールすると、このLUNに関連する「ストレージアレイ」に警告が表示されていた。カーソルを当てると、このストレージアレイでパフォーマンス劣化が生じていることがわかる。ダブルクリックでドリルダウンしてみると、このストレージアレイを使用している多数のLUNで、同様にパフォーマンス劣化(大きなレイテンシの発生)が起きていることもわかった。
つまり、このアプリケーション(SQLインスタンス)の障害を解決するには、使用しているLUNやストレージアレイのチューニング、もしくは構成変更を行う必要があることがわかった。作業すべきなのはデータベース管理者ではなく、ストレージ管理者である。
* * *
このように、AppStackは障害原因の切り分けや究明の作業を、とても容易にしてくれるツールだ。冒頭で挙げた今月のトラブルのようなケースでも、誰が対策を取るべきかが一目でわかるので役に立つはずだ。
※注:本記事中で使用している画面はデモ環境のものであり、実際の通信環境とは異なります。
(提供:ソーラーウインズ)
この連載の記事
-
第7回
デジタル
「QoEダッシュボード」と「AppStack」でトラブル解決してみる -
第5回
デジタル
適切なNW増強計画のために「NTA」でトラフィック量を可視化 -
第4回
デジタル
「UDT」で持ち込みデバイスのネットワーク接続を監視する -
第3回
デジタル
何十台ものネットワーク機器設定、その悩みを「NCM」が解消する -
第2回
デジタル
ネットワーク?サーバー?QoEダッシュボードで障害原因が見える -
第1回
デジタル
なぜ、いま運用管理の“バージョンアップ”が必要なのか - この連載の一覧へ