より良いデータと実用的な洞察はほんの始まりに過ぎません。
より多くの選択肢とより複雑な AIOpsバイヤー
2022年までに、ガートナーは次のように予測しています。 大企業の40%がAIOpsソリューションを採用します 終わりのない警報洪水に対処し、確実にするために 破壊的なIT停止からのより迅速な回復。 AIOps市場は、企業の爆発的な採用、収益の成長の加速、IT運用プレーヤーからの継続的な投資により、急速な成長を遂げています。スタンドアロンのポイントツールはこれまでAIOps市場を定義および形成してきましたが、隣接する多くのベンダーが、競争力のあるAIOpsポートフォリオを構築するために企業を構築または買収しています。
図1-監視、アラート、ログ分析の企業はすべて、AIOps市場を積極的にターゲットにしています。
過去数年間の注目すべきAIOpsの買収には次のものがあります。
-
2015年、 Splunkが異常検出スタートアップMetaforを買収perfect、IT運用分析機能について。 2016年、Splunkは、機械学習を使用してITサービスの停止を予測および防止するITサービスインテリジェンス製品を発表しました。
-
2015年、 PagerDutyがEventEnrichmentHQを購入しました 次に、イベントインテリジェンス製品をリリースして、運用の健全性を向上させるための適切な洞察を提供しました。
-
2017年、Cisco AppDynamicsは、ストリーミングデータ会社Perspicaの買収を発表しました。 2019年、AppDynamicsはCognition Engineを立ち上げ、AIOps機能をアプリケーションパフォーマンスの監視にもたらしました。
-
2018年には、2つの小さなAIOpsベンダー、Savision(Martello Technologies Groupが買収)とEvanios(HPが購入)の撤退が目撃されました。
-
2019年、 NewRelicがSignifAIの買収を発表、マシンインテリジェンスによるより高速でスマートなインシデント解決に焦点を当てたスタートアップ。
End Swivel-Service-CentricAIOpsを使用したIT運用の議長
AIOps市場での激しい競争とその結果としての混乱を考えると、DevOpsチームとSREチームは、現代のインシデント管理に適したAIOpsソリューションをどのように選択するのでしょうか。 OpsRampでは、 サービス中心のAIOpsソリューション の特異なビジョンを持つ「ITイベント管理に費やされる人的時間の最大95%を排除します。」
Figure 2 - OpsRampサービス中心のAIOps: インシデント管理は、トラブルシューティングを迅速化するための強力な機能です。
OpsRamp かかります 包括的なIT停止ライフサイクルソリューションを使用して、アラート疲労、絶え間ない消火活動、およびITスタッフの燃え尽き症候群の問題に対処するための包括的なアプローチ:
-
サービスコンテキスト。 OpsRampのサービスコンテキストは、ハイブリッドアプリケーション、インフラストラクチャリソース、およびビジネスサービスの運用面のコンテキスト関係を理解して提示することを目的としています。サービスコンテキストは、ポリシーベースの検出、トポロジモデル、およびサービスマップに関するOpsRampの機能を組み合わせて ITイベントストリーム分析のために、全体的な可視性を提示し、ビジネスへの影響を予測します。
-
インテリジェントアラート。 OpsRampのネイティブインストルメンテーションは、レガシーワークロードと最新ワークロードの両方に関連するメトリックを使用して実用的な洞察を提供します。動的な変更ベースおよび予測ベースのアラートしきい値は、ITチームが動的インフラストラクチャリソースの真の状態を理解するのに役立ちます。 OpsRampは、注意と優先順位付けを必要とする基盤となるIT環境の重要な変更を検出した場合にのみイベントを生成します。
-
イベント相関。 OpsRampによって処理されるネイティブアラートとサードパーティアラートの両方に、多くのコンテキストが含まれています。 OpsQイベント管理エンジンは、データサイエンス技術と機械学習アルゴリズムを使用して、イベントボリュームを分析、重複排除、および削減するための適切な推論モデルを適用します。
-
自動修復。 OpsRampは、明確に定義されたIT運用上の問題にプログラムによる修復を適用し、ソフトウェア制御のアクションで適切な応答(サーバーの再起動またはプロセスの再起動)を呼び出します。 DevOpsチームには、可能な限り自動化されたアクションでインシデントを解決するオプションがあり、人間のオペレーターが表示、分析、またはトリアージするイベントが少なくなります。
ポイントツールがポイントを見逃す理由
スタンドアロンのAIOpsツールは重要なイベントパターンにフラグを立てることができますが、OpsRampのサービス中心のAIOpsソリューションは、エンドツーエンドのインシデント管理のためにデータ、コンテキスト、および洞察を組み合わせます。 OpsRampを使用すると、DevOpsチームは、イベント認識、影響分析、根本原因の特定、インシデントのエスカレーション、自動修復などのインシデントワークフローアクティビティを1か所で処理できます。
OpsRampがリアルタイムのITイベントの洞察、プロアクティブなインシデント対応、およびサービスの健全性管理のためのAIOpsポイントツールとの戦いに勝つ4つの理由は次のとおりです。
-
ネイティブインストルメンテーションによるデータ品質。ネイティブを使用したデータ品質世界で最高の機械学習アルゴリズムはすべて、入力するデータの品質に依存します。ソースでITイベントデータの品質と形式を制御できない限り、パターン認識と検出の結果は最適ではありません。 OpsRampは、データ入力を制御し、専用データの脆弱性を回避することで、より良いデータ品質を保証します。 OpsRamp OpsQは、aInstrumentationからのサードパーティイベントのデータモデル、メタデータ、および専門家の推奨事項を適用します。 多様な統合エコシステム 時間の経過とともに外部データの品質を改善および強化するため。
-
より迅速なトラブルシューティングのための影響分析。 イベントを理解し、それを修正する方法を知るには、そのサービスコンテキストを理解する必要があります。このコンテキストがない場合、ユーザーは1つのインシデントを他のインシデントよりも優先する根拠がありません。 OpsRampのトポロジマップとサービスグループにより、ITチームは特定のイベントの背後にあるコンテキストを理解し、影響分析を適用してサービスをより迅速に復元できます。
-
関連するメトリックを使用したインシデントの解決。イベント相関を実行したら、どのように問題を解決しますか?メトリックは、問題を切り分け、適切なパフォーマンスインジケーターで問題を理解し、インシデントを正しく解決していることを確認するのに役立ちます。 AIOpsツールは、パフォーマンス監視メトリックデータにアクセスせずに、インシデント管理パズルの一部にしか対処できません。
-
イベント「スモッグ」を減らしました。 すべての障害が自動修復できるわけではありませんが、ソフトウェア定義環境の採用が増えると、自動化によってインシデントのより多くの割合を処理できるようになります。スタンドアロンのAIOpsツールには、問題を修正することなく問題を修正できる自己修復型の運用ワークフローがありません。 人間の介入。
図3-OpsRampがリアルタイムのインシデント管理に適したAIOpsプラットフォームである理由は次のとおりです。
次のステップ:
- 詳細についてはOpsQ、サービス中心のAIOps OpsRampから。
- Download our クラウドスキル危機レポート ここ。
- カスタムデモンストレーションをスケジュールする今日はソリューションコンサルタントと一緒に。