自動アラート抑制により、中断を減らし、生産性を向上させます 

最新のハイブリッド、マルチクラウド、およびクラウドネイティブ環境により、エンタープライズITチームの管理が複雑になっています。動的で分散型のアプリケーション、インフラストラクチャ、およびビジネスクリティカルなサービスは、メトリック、イベント、およびアラートの形式で常により多くのデータを生成しています。終わりのないアラート通知が絶え間なく続くと、ITサポートチームが燃え尽きて鈍感になり、「警戒疲労による死亡。 "IT運用チームは、どのようにして絶え間ないアラートストームに先んじて、重大なインシデントについてのみ通知を受け取るのですか? 

OpsRampの自動アラート抑制管理は、不要なアラートノイズを排除し、オペレーターが繰り返しアラートに溺れるのを防ぎます。動的アラート抑制により、DevOpsチームは大量のアクション不可能なアラートを安全に無視し、冗長なアラートに悩まされることなくインシデント対応に優先順位を付けることができます。自動アラート抑制は、ファーストレスポンスポリシーを使用して既知および予想されるアラートを検出するため、IT管理者は動的なIT環境全体でアラートの過負荷に悩まされることはありません。 

意味のある実用的なアラートのために機械学習を採用する

学習ベースの自動アラート抑制は、何百もの重複した無関係なアラートに襲われる代わりに、影響の大きいイベントと影響の少ない問題を簡単に区別することで、インシデント対応チームが信号をノイズから分離するのに役立ちます。自動アラート抑制ポリシーは、手動の労力を要するプロセスですべてのアラートに対処する代わりに、頻繁で不要なアラームの最初の応答メカニズムとして機能します。

私たちの最近2019年夏のリリース ITプロフェッショナルが毎日何千ものアラートを手動でふるいにかける必要がないように、ノイズの多い繰り返しのアラームを自動的に処理するアラート管理のファーストレスポンスポリシーを導入しました。 OpsRampは、予防的なイベント検出を保証し、イベントの過負荷を防ぐファーストレスポンスポリシーを構成するための2つのオプションを提供します。

  • 時間ベースの抑制(季節的および定期的なアラートを抑制します)。 機械学習ポリシーは、全体的なイベントの動作を理解し、特定の期間に季節的に発生するITイベントを抑制します。季節的なアラートは通常、パブリッククラウドサービスからの自動スケーリングイベントやピーク営業時間中の多数のトランザクションなど、IT運用プロセスが繰り返し発生するために発生します。 

  • 属性ベースの抑制(特定の特性に一致するアラートを抑制します)。 戦いに強いITチームは、実稼働環境を全体的に理解しており、時間に敏感なインシデントの際にアラートが重要かどうかをすばやく判断できます。 ITプロフェッショナルは、抑制が必要な必要な属性を定義するCSVファイルをアップロードすることで、これらの固有の操作パターンを検出するようにOpsRampの機械学習アルゴリズムをトレーニングできます。学習ベースの自動抑制は、一致基準を使用して操作手順から発生するアラートを認識し、ITチームが冗長なアラートに時間を浪費しないようにします。

Suppress seasonal and attribute-based alerts

属性ベースの抑制(特定の特性に一致するアラートを抑制します)。

絶えず変化するIT環境のアラートルールを頻繁に更新する代わりに、機械学習ベースの動的アラート抑制はイベントパターンを認識し、重要でないアラートを除外します。 OpsRampの最初の対応ポリシーは、不要な季節的および属性ベースのイベントを抑制し、絶え間ない消火活動を減らし、予防的なインシデント対応を保証することにより、運用効率を高めるための効果的なメカニズムを提供します。 

Auto-alert suppression management

図2-自動アラート抑制管理により、アラートフラッドの分析、確認、および処理に時間を浪費するのを防ぎます。

次のステップ:

State of AIOps report CTA

Recommended posts