冗長化システムの潜在故障の発見

情報システム部門の煩わしい業務を効率化
ITサービスの運用を変革します。[お問合せ]

[1] 冗長化システムの潜在故障の発見
[2] 本ページで紹介するシステム構成
[3] 冗長化システムへの試験内容
[4] アクセス割合の抽出
[5] まとめ

1.冗長化システムの潜在故障の発見   テストトライアルにJump new

 本ページでは、一般的なWEBサーバの冗長化機器の状況の見える化について解説します。




2.本ページで紹介するシステム構成

 インターネット上のロードバランサ配下にWEBサーバがあるシステムをEEC(End to End Checker)で情報を入手し、冗長化サーバの運用状況を見える化します。
 下の図がシステム構成になります。

ITサービスレコーダー 冗長化システム_1




3.冗長化システムへの試験内容

 EECより、http://xxx.yyy.zzz/ (または、https) にアクセスを定期的に行い、その遷移を入手します。

 以下、ログの例を示します。この場合冗長機器は3台になります。

Job:【蓄積ファイル名】【試験間隔】【試験回数】【試験URL】

<+>---<+>---<+>---<+>---<+>---<+>---<+>---<+>---
スパイダーモードが有効です。リモートファイルが存在してるか確認します。
2016-10-20 15:59:40-- https://www.xxx.yyy/
www.xxx.yyy をDNSに問いあわせています... aaa.bbb.ccc.94, aaa.bbb.ccc.92, aaa.bbb.ccc.91
www.xxx.yyy|aaa.bbb.ccc.94|:443 に接続しています... 接続しました。
HTTP による接続要求を送信しました、応答を待っています... 200 OK
長さ: 159086 (155K) [text/html]
リモートファイルが存在し、さらなるリンクもあり得ますが、再帰が禁止されています -- 取得しません。
Before_time: 15:59:40.600786794
After_time : 15:59:41.687601810
Job_time : 1.086815   ←処理時間
EEC_REC:15:59:40,www.xxx.yyy,1.087
<+>---<+>---<+>---<+>---<+>---<+>---<+>---<+>---




4.アクセス割合の抽出

 冗長機器のアクセス割合は設計ポリシーによって変わりますが、アクセスされた機器ごとの応答時間に違いがあるかの把握は重要です。

 本システム構成の機器に、60秒毎に1,500回の試験を行った結果を示します。
サーバー     アクセス回数
aaa.bbb.ccc.92     508
aaa.bbb.ccc.94    505
aaa.bbb.ccc.91    487
         計 1,500

 本ページの例では、冗長機器にほぼ均等にアクセスされいるのが分かります。

 次に、各機器の処理の応答時間を示します。
機器 aaa.bbb.ccc.91 の処理時間の分布
0.4秒台   2 回
0.5秒台  93 回
0.6秒台  153 回
0.7秒台  82 回
0.8秒台  38 回
0.9秒台  28 回
1.0秒台  18 回
1.1秒台  15 回
1.2秒台   9 回
1.3秒台   5 回
1.4秒台   4 回
1.5秒台   1 回
1.6秒台   5 回
1.7秒台   2 回
1.8秒台   2 回
1.9秒台   4 回
2.0秒以上 26 回

機器 aaa.bbb.ccc.92 の処理時間の分布
0.4秒    2 回
0.5秒   103 回
0.6秒   145 回
0.7秒   91 回
0.8秒   51 回
0.9秒   37 回
1.0秒   15 回
1.1秒   14 回
1.2秒    7 回
1.3秒    2 回
1.4秒    6 回
1.5秒    4 回
1.6秒    7 回
1.7秒    1 回
1.8秒    4 回
1.9秒    1 回
2.0秒以上 17 回

機器 aaa.bbb.ccc.93 の処理時間の分布
0.4秒    3 回
0.5秒   100 回
0.6秒   153 回
0.7秒   89 回
0.8秒   41 回
0.9秒   25 回
1.0秒   22 回
1.1秒   15 回
1.2秒    8 回
1.3秒    4 回
1.4秒    2 回
1.5秒    3 回
1.6秒    2 回
1.7秒    6 回
1.8秒    3 回
1.9秒    3 回
2.0秒以上 25 回

本ページの例では、各機器の処理時間の分布もほぼ同様になっています。




5.まとめ

 EEC(End to End Checker)のカスタマイズ試験を行うことにより、冗長構成のシステムで、どの機器が利用される頻度、及び、各機器の処理時間を把握することができます。

 SalesForceアクセスの遅延のページは、冗長化システムに問題があった例を記述しています。

 保守・運用サービスに必要なこと(5つのポイント)のページへ

ページのトップへ戻る