IT運用チームが大量のアラートで迷子になることは何回ありますか?あなたのビジネスを狂わせる可能性のある事件をすぐに理解できますか? OpsRampのIT運用のための新しい人工知能(AIOps )推論エンジンは、OpsRampから生成されたイベントを相互に関連付けます サードパーティのツール 無限のアラートフラッドの管理に役立ちます。私たちが立ち上げたAIOps推論エンジンがどのように OpsRamp 5.0、最新のイベント管理の複雑さを抑えるのに役立ちます。
なぜAIOps?そしてなぜOpsRamp?
AIOpsと機械学習は、エンジンに電力を供給するデータと同じくらい効果的です。そして、そのデータが状況に応じて完全である場合に役立ちます。既存のポイントツールとレガシーIT運用管理(ITOM)スイートは、検出、監視、イベント相関、アラート、サービスデスクなどの製品またはスタンドアロンモジュールを使用して、サイロ化された運用を処理できます。対照的に、OpsRampは、統合されたSaaSプラットフォームでITインフラストラクチャのより豊かでより深いコンテキストビューを提供します。つまり、IT運用データ全体をベンチマークして、真に包括的なビューを実現できます。
OpsRampの大規模なビッグデータプラットフォームは、ハイブリッドアプリケーションとインフラストラクチャ全体の障害とパフォーマンスのメトリックを収集することにより、AIOpsエンジンを強化します。次に、エンジンは、統計的証拠と推論を使用して、運用イベント全体で関連する洞察を抽出します。 OpsRampの推論エンジンは特定のイベントを相互に関連付け、それらをグループ化します。 Inference.この投稿では、このエンジンがどのように機能するかについて詳しく説明します。
AIOps推論エンジンの構成
OpsRampは、サービスの可用性とパフォーマンスの監視のための強力な機能を当社の一部として提供します ユニファイドサービスインテリジェンス 解決。 OpsRamp 5.0は、新しい推論エンジンでこれをさらに一歩進めました。トポロジベースの相関とクラスタリングベースの相関という2つの異なるモデルに基づいて構築された高度な分析機能を使用して、動的でプロアクティブな洞察を提供します。
トポロジベースのイベント相関
さまざまなアプリケーションおよびインフラストラクチャリソースが、ビジネスクリティカルなITサービスを構成する可能性があります。 ITサービスに関する大量のアラート通知を受け取った場合、ハイブリッドワークロード全体で実際に何が起こっているのかを理解する必要があります。この点を説明するためのいくつかのシナリオを次に示します。
- ベアメタルハイパーバイザー(VMware ESXi)は、複数のアプリケーションを実行するさまざまなゲストマシンをホストします。 ESXiハイパーバイザーがダウンすると、ゲストホストに影響を与え、アプリケーションの停止につながります。
- データセンター内の複数のスイッチがネットワークアクセススイッチに接続します。アプライアンスの誤動作によりアクセススイッチが故障すると、すべてのダウンストリームスイッチも影響を受けます。
- 分散型クラウドアプリケーションには、3層アーキテクチャ(アプリ、ミドルウェア、ネットワーク)があります。これらのアーキテクチャレイヤーの1つに影響があると、アプリのパフォーマンスが低下します。しかし、実際に問題を引き起こしているのはどのレイヤーですか?
OpsRamp’s トポロジベースのイベント相関 ITサービスを構成するアップストリームおよびダウンストリームのリソースを視覚化するのに役立ちます。影響を受けるリソースの相互に関連するメトリックの共通セットを使用して、アラートを相互に関連付けることができます。依存リソースのイベントストリームを表示すると、推論エンジンは事前定義された条件に基づいてそれらを相互に関連付け、推論としてグループ化します。
図1-トポロジベースのイベント相関を使用して、イベントの関連アラートをグループ化します。
クラスタリングベースのイベント相関
最新のサービスのトポロジをどのように追跡し、そのイベントを相互に関連付けますか?オンデマンドインフラストラクチャでは、さまざまなサービスのインフラストラクチャ依存関係を処理するのは簡単ではありません。だから私たちは紹介しました クラスタリングベースのイベント相関 そのため、属性に基づいてイベントを相互に関連付けるルールを作成できます。
監視システムに入ってくるイベントには、ホスト名、アラートの件名、IPアドレス、重大度、メトリックなど、多くの情報が含まれています。クラスタリングベースの相関は、イベント全体で同様の属性を使用し、それらを推論に相関させます。 ITチームは推論を分析して、停止のトラブルシューティングと修正を迅速に行うことができます。
ハイブリッドワークロードのクラスタリング。 ハイブリッドワークロードをサポートするリソースは、非常に動的でスケーラブルです。 AIOps推論エンジンは、命名規則、IPアドレスのサブネット、カスタム属性などの同様の属性を持つリソースにルールを適用することにより、ハイブリッドパフォーマンスの問題の根本原因を抽出します。
図2-推論エンジンはルールを使用して、ハイブリッドインフラストラクチャ全体でイベントを相互に関連付けます。
アプリケーションの劣化を観察する場合、それは基盤となるインフラストラクチャが原因である可能性があります 問題。クラスタリングベースのイベント相関は、トポロジ情報なしでインフラストラクチャ全体の関連イベントをグループ化します。クラスタリングは、基本OSメトリック、カスタムモニタリング、ログファイルモニタリング、およびプロセスモニタリングに使用できます。 OpsRampは、IT環境のさまざまなワークロードに同じルールセットを割り当てるために必要な柔軟性を提供します。
図3-ルール、相関、およびクラスタリング。すべてを1か所に。
Conclusion
OpsRampの IT運用管理プラットフォーム AIOpsの推論を通知(電子メール、テキスト、音声、またはチャット)としてエスカレーションしたり、自動インシデントを作成したりできます。これらはすべて1か所で行えます。 OpsRampでイベントを消費し、終了まで追跡することで、さまざまなIT管理ツールからのイベントをクラスター化することもできます。
AIOpsの推論を通知(電子メール、テキスト、音声、またはチャット)としてエスカレーションしたり、自動インシデントを作成したりできます。これらはすべて1か所で行えます。 OpsRampでイベントを消費し、終了まで追跡することで、さまざまなIT管理ツールからのイベントをクラスター化することもできます。