情報システム部門の煩わしい業務を効率化
ITサービスの運用を変革します。[お問合せ]
遅延の原因は様々な理由があります。【参考:遅延から分かること】
今回の例は、お客様から、アプリのレスポンスが遅くなるとの申告があり、調査した結果、
・ping試験の遅延はそれ程遅くない。
・帯域使用量は余り多くない。
の状況でしたが、timeoutが多数発見されました。
timeout が発生すると、アプリレベルでのリトライが繰り返され、結果的にエンドユーザ様の業務操作においてレスポンスの遅れとなります。
1.現場に設置したITSRのデータ
ITSRを設置し、「EECの監視機器の登録推奨手順 と 品質が常に向上する施策」に従い、監視機器を設定します。
以下は、本例のシステム構成です。
お客様は、各拠点から、DCに設置したあるサーバにアクセスを行っています。
赤矢印で、各拠点Routerへの ping 試験を行いました。
◆ ベストエフォート回線
以下に示しますのは、ある拠点[ベストエフォート回線]のある日の午前中のデータです。
ping試験自体の timeout 値は、1,000ms 、試験の間隔は、約 35秒の設定になっています。
・混雑時のレスポンスのMax値は、70~85ms となっており、百ms を超えるような遅さにはなっていません。
・timeout の回数は非常に多くなっております。
以下に、9時台の全ての試験結果を示します。
このように timeout が頻発すると相当使い勝手が悪いと考えられます。
◆ ギャランティ回線
比較として、ある拠点[ギャランティ回線]の同時刻の状況を以下に示します。
・遅延は若干発生しています。
・timeout の回数、1回のみとなっております。
2.考察 & Action
「1.現場に設置したITSRのデータ」で示した通り、明らかにベストエフォート回線とギャランティ回線で違いがあります。
【Action】
(1) 監視間隔を1秒にする。
ITSRの監視において、該当の機器(Router)を別グループにして、1秒毎にping試験を行うようにし、より詳細の現状把握を行います。
(2) パケットキャプチャーの実施
システム構成の ① にミラーポートを作成し、パケットキャプチャーを実施します。
・エラーパケットが頻繁していないか。
・必要でない機器から大量のパケットが送出されていないか。 等を調べます。
参考:帯域に余裕があるのにRouterが落ちる
調査の結果、通信状況自体に問題がない場合は、ベストエフォート回線から別の品目に変更する 等の検討が必要となりす。
今回の例では、トラフィック量だけを見ていてもトラブルの発見ができず、多方面からのトータル監視が必要なことが分かります。
参考:トータル監視運用サービスの考え方に則った EECの監視機器の登録推奨手順 と 品質が常に向上する施策