情報システム部門の煩わしい業務を効率化
ITサービスの運用を変革します。[お問合せ]
ITSRは、
・ITインフラサービスが問題なく使い続けることができ、
・トラブルが発見される前に、トラブルの兆候を発見し、できるだけサービスの停止期間を減らすこと
を目的としています。
しかしながら、情報システム部門の仕事は多岐にわたり、多忙なため、
「今の状態で問題がないのか。何か対処を打つべきか」の検討に中々時間を取ることができません。
弊社では、次の2点に重点を置いた、アクションレポートを月一回提出します。
(1) 閾値の見直し
よく一般に行われている保守・運用サービスでは、
「構築時に監視の閾値を決め、その閾値が超えた場合にアラームを出す。」
が行われています。
この方法では、閾値を超えない場合は、サービスレベルが上がっているのか、下がっているのか分かりません。故障(閾値を超えて)になって、それから慌てて対応になってしまいます。
ITSRでは、
問題がない場合でも、遅延にフォーカスして、レスポンス値の閾値をシビアにし、月に数回程度はアラーム記録が残るように設定します。
問題がありそうな機器は、試験間隔、試験内容をシビアにし、特別監視を行います。
(2) カスタマイズ試験の追加
潜在故障等原因が分かり難い場合は、カスタマイズ試験を行い各種トラップを設定し、原因究明を試みます。
一度遭遇した不具合は、その発見過程で行った技術者の作業内容(シナリオ:切り分け、試験)をプログラミング化して、カスタマイズ試験として追加します。
過去に起こったトラブルについては、カスタマイズ試験により、次からは、エンドユーザの申告前に症状を把握することを目指します。
以上のアクションレポートにより、常にITインフラサービスが向上し続けるようにPDCAを回す取り組みを行います。
アクションレポートの例(抜粋)(pdf)