「見える」からわかる!システム障害の原因をあぶり出すテク 第7回
異なる視点から「見える」2つのツールを組み合わせ、迅速な解決を目指す
「QoEダッシュボード」と「AppStack」でトラブル解決してみる
2016年03月08日 09時00分更新
QoEとAppStackを使って「アプリが遅い」原因を調査する
では実際に、冒頭で挙げた今月のトラブルの原因を、QoEとAppStackを組み合わせて使って調査する手順を見てみたい。ソーラーウインズのオンラインデモサイトを利用する。
まずは、QoEダッシュボードで“ネットワークの視点”から見てみよう。「アプリケーション応答時間」ウィジェットのトップ10リストを見ると、アプリケーション応答時間のリストにWindowsのファイル共有プロトコルである「CIFS」のアラートが表示されている。
さらに、折れ線グラフの表示をCIFSだけに絞り込むと、アプリケーションのレスポンスがおよそ500ミリ秒~7秒の間で繰り返し変動していることがわかる。「レスポンスタイム7秒」というのは異常に遅く、SharePointサーバーはCIFSを使用するので、これがSharePointアプリケーションの動作を遅くしている可能性が高い。CIFSについてさらに調査してみよう。
さらに「QoEアプリケーション統計値」というリストでCIFSの項目を開くと、「lab-dem-spapp01.demo.lab」というノード名が表示される。これは、CIFSプロトコルを使って通信しているノード(サーバー)だ。ここでも「平均アプリケーション応答時間」にアラートが出ているが、一方で「ネットワーク応答時間(TCPハンドシェイク)」はアラートが出ていない。
したがって、この段階でまず「CIFSのレスポンス遅延の原因は、ネットワーク側ではなくアプリケーション側にある」と判断できる。
それでは、アプリケーション側のどのコンポーネントがCIFSのレスポンス遅延の原因になっているのだろうか。さらに掘り下げて調査していこう。
この連載の記事
-
第6回
デジタル
アプリ障害の原因はインフラのどこに?「AppStack」が簡単解決 -
第5回
デジタル
適切なNW増強計画のために「NTA」でトラフィック量を可視化 -
第4回
デジタル
「UDT」で持ち込みデバイスのネットワーク接続を監視する -
第3回
デジタル
何十台ものネットワーク機器設定、その悩みを「NCM」が解消する -
第2回
デジタル
ネットワーク?サーバー?QoEダッシュボードで障害原因が見える -
第1回
デジタル
なぜ、いま運用管理の“バージョンアップ”が必要なのか - この連載の一覧へ