ここ数ヶ月、主要なクラウドおよびテクノロジープレーヤーは、企業の資金を獲得するために最新の製品と戦略を展開しています。注目を集めているトレンドの1つは、ハイブリッドインフラストラクチャ管理です。オンプレミス、プライベートクラウド、パブリッククラウドのリソースを組み合わせてサポートする必要があります。  

今日の典型的な企業ハイブリッドクラウドインフラストラクチャ パフォーマンス、俊敏性、コンプライアンス、コストの理由など、ビジネスに最適な場所でアプリケーションとデータをホストするための柔軟性がこれまでになく向上しています。

欠点は、ハイブリッド(および マルチクラウド)環境はより複雑であり、次の結果になります。

  • 一般的に、より多くのアラートとイベント。
  • クリックストリーム、トランザクション、モバイルデバイスやIoTデバイスからのマシン生成イベントなど、よりグローバルに分散されたイベント。
  • サイロ間の影響を伴うより複雑なイベント。

これは大きな問題を引き起こします。 IT監視チームは、サービスの問題を特定して解決することを非常に困難にする、切断されたテクノロジ固有の情報に苦労しています。ドメイン間でデータを手動で相互に関連付けることは非常に時間がかかり、失われた収入 主要なサービスがダウンした場合。 

典型的な間に インシデントエスカレーション シナリオでは、サポートがドメインエキスパートに電話をかけると、何が悪いのかについて同意できる人はほとんどいません。各チームは、何が壊れているかについて独自の見解を持っており、他の場所に指を向けています。その結果、企業はサービスの停止が長引くことになり、ビジネスに深刻な影響を与える可能性があります。典型的な問題は、アラートのカスケードです。最初のアラートが他のいくつかのアラートをトリガーすると、元のアラートからアラートノイズを取り除き、根本的な原因を見つけるための長い調査サイクルが作成されます。カスケードアラートは、 カスケード障害;イベントデータの迅速なフィルタリングと相関がなければ、それは潜在的なビジネス災害です。

同時アラートは、不要なノイズも生成します。クラスタ内のさまざまなサーバーにコード更新をロールアウトし、更新にバグがあり、各サーバーでアラートが発生するとします。各アラートの原因が同じ問題である場合でも、各サーバーアラートの原因の特定には非常に長い時間がかかります。

現代の方法を見てみましょう デジタルオペレーションコマンドセンターフレームワークは、ハイブリッドクラウド管理の余分な作業を減らすことができます.

一般的なアラート管理ワークフローには、次のものが含まれます。

  1. アラートと一般的な原因との相関関係。
  2. 解決のためのアラートの優先順位付けと優先順位付け。
  3. インシデントチケットの作成など、問題管理を改善するためのITサービス管理(ITSM)ツールとの統合。

コマンドセンターフレームワークでは、これらのすべてのステップは、カスケード、クロスサイロ、および同時アラートの根本原因を特定するのに役立つAIおよびポリシーベースのツールを使用して、中央の場所またはプラットフォームで自動的に処理されます。 NS最新のIT運用システム 有効にする必要があります:

  • 多くの既存の監視ツールの統合を含む、イベントの収集と集約のためのインストルメンテーションと統合。
  • NS アラートのフィルタリング、集約、重複排除;
  • 人間の介入なしのイベント相関と影響分析。
  • 全自動 最初の応答可能な場合は自動修復。
  • 必要に応じて、人間のオペレーターへの自動エスカレーション。

研究によると、このAIベースのアプローチは アラート管理 人間の操作を必要とするアラートの数を90%削減できます。人間との対話、自動化されたイベント作成、インシデントルーティングを必要とするアラートの場合、分析主導の根本原因の特定と相まって、平均解決までの時間(MTTR)が50%以上短縮されます。これは、企業の収益に大きな影響を与える可能性があります。 

私の次の投稿で 、デジタルオペレーションコマンドセンターを確認します ROI ハイブリッドクラウドインフラストラクチャを最新化するための最新のフレームワークの採用を加速するのに役立つ可能性のあるモデル。

次のステップ:

Calculator_CTA

Recommended posts