AIOps主導のIT運用のためのデータの再考

次の記事 first appeared Datanamiで。

ハイブリッド企業の台頭は、ITチームに大混乱をもたらしています。 ITサービス/運用管理(ITSM / ITOM)は、インフラストラクチャがより複雑になり、より複雑になり、より多くのリソースを消費するようになるため、これまで以上に困難になっています。

クラウドネイティブアーキテクチャ、DevOps、マルチクラウドインフラストラクチャなどの新しいテクノロジーは、ITチームに機会を生み出すのと同じくらい多くの問題を引き起こしています。新しいシステム、プラットフォーム、またはソリューションはそれぞれ、通常は専用の監視ツールとレポートダッシュボードを介して、継続的に監視および管理する必要があります。

イベントとアラートの量が絶えず増加しているため、ITチームには、すべてのデータを手動で評価、関連付け、操作するための時間や人員がありません。さらに悪いことに、ITリーダーは、チームやドメイン間で異なる断片化されたテクノロジー、断片化されたデータ、および異なるツールセットを統合するのに苦労しており、解決までの時間が長くなり、サービスを常に最高のパフォーマンスで実行し続けることがほぼ不可能になっています。

ガートナーは、ITOMに対するデジタルビジネスの需要は今後も激化して進化し続けると予測しています。しかし、データ量の増加率は、テクノロジーと人員に費やす企業の能力を上回っており、潜在的に影響力のある洞察が亀裂をすり抜けて、組織におけるIT運用の役割を大幅に切り下げています。

AIOps:増大する課題に対する明らかな解決策

TこれらのITチームは、膨大な量のITインフラストラクチャデータをふるいにかけるために、IT運用のための人工知能(AIOps)に目を向けています。イベントやログからテレメトリデータやその他のワークロードのパフォーマンスと可用性の情報まで、ITリーダーは求めています包括的なソリューション 最も時間とリソースを消費するITOpsアクティビティの多くを自動化して、チームがデジタルイノベーションと変革を推進する上でより戦略的な役割を果たせるようにします。  

IT関連のイベント管理を 単気筒 冗長または重複する機能を備えたツールから重複情報を排除し、戦略的意思決定に使用されるデータを標準化しながら、さまざまなデータソースの関連付けを容易にします。計算技術と高度なアルゴリズムは、インフラストラクチャ、一般的なIT管理ツール、およびエンタープライズプロセス全体のさまざまなインシデントを予測し、それらを自律的に解決するのに役立ちます。


ノイズと干渉を排除するための適切な周波数を見つける

すべての機械学習とAIベースのテクノロジーは、データとその多くによって推進されています。しかし、システムが適切なデータ(最もクリーンで最も関連性の高いデータ)を確実に取得することが、コアITSMアクティビティを正常に自動化する秘訣です。

特定のデータを受信したときにのみ非常にクリアなサウンドを生成できるラジオのように、AIOpsツールも、環境全体の非常にクリアで動的なスナップショットを生成するために、適切なデバイスから特定のデータ信号を受信するように構成する必要があります。アプリケーションパフォーマンスモニタリング(APM)やネットワークパフォーマンスモニタリング(NPM)ツールなどのボルトオンポイントツールは、限られたより一般的なデータを収集し、ノイズや干渉の増加につながる可能性があります。これは、ラジオダイヤルがハーフティックを設定したときに聞こえる静的なものと同様です。ターゲットのラジオ局の帯域外。

AIOpsツールは、今日の広大なIT環境に共通する、潜在的に数千のデバイス、コンポーネント、または顧客のタッチポイントの中から最も優先度の高いエンドポイントからデータを受信するように構成する必要があります。プラットフォームは、これらすべてのシステムとエンドポイントからのデータを集約し、不要な信号を除外して、どのデータ信号に最も注意を払うかを優先し、推論モデルを使用して精度と関連性を検証する必要があります。

そのように、実用的な洞察は文脈的で関連性のある既存の環境に。事実上、最もクリアな出力を得るために最適な信号を抽出するようにラジオを調整しています。

ダイヤルを回す:ラジオを調整する方法

ラジオのチューニングは、ダイヤルを回すのと同じくらい簡単です。カントリーミュージックを聴きたいですか?特にカントリーステーションの周波数に合わせて調整します。曲に変化があると、静的な信号が発生したり、他の信号が引き込まれたりして、リスナーの体験に悪影響を与える可能性があります。

AIOpsプラットフォームの調整は、無線の調整よりも複雑ですが、原則は同じです。ソリューションを強化するアルゴリズムは、特定の運用およびビジネスの目的に合わせて「調整」する必要があります。たとえば、サービスの中断を事前に特定し、優先度の高いサービスの復元にITの取り組みを集中させるには、アルゴリズムを特に予測と変更の検出アラートに合わせて調整し、ユーザーに影響が及ぶ前に、容量またはパフォーマンスの低下状態をできるだけ早く特定する必要があります。

同様に、アラートが互いにどのように関連しているか(マイクロサービスの停止がバグによる孤立したインシデントであるか、それとも他のサービスを停止するか)を理解するには、どのアラートが有効で、別のアラートが有効であるかを推測するように設計されたアルゴリズムが必要です。アラートを自動的に解決できるかどうか、または特定のユーザーに手動で対処するように通知する必要があるかどうかを指定するルール。

AIOpsプラットフォームの価値は、特定のデータを取り込み、特定のコマンドを正確に実行する機能に直接関係しています。ジェネリックアルゴリズムを構築すると、ビジネス目標を進める上でほとんど価値や有用性をもたらさない、限られたジェネリックな結果が常に得られます。

代わりに、アルゴリズムは、具体的に定義された結果と目的に適合させる必要があります。これは、各データストリームのルールを個別に手動で再調整する代わりに、アルゴリズムによって取り込まれる前にデータを解析し、適切な情報のみを配信するネイティブインストルメンテーションを備えたソリューションの場合と非常によく似たシナリオです。

高品質の信号+適切なチューニング=高忠実度の「サウンド」

AIOpsの主な利点は、大量のデータを自律的にコンテキスト化することです。そうしないと、人間のスタッフには時間、エネルギー、またはノウハウがない可能性があります。信号生成と信号処理を調整して高品質のサウンド出力を作成するという無線のアナロジーを維持しながら、AIOpsはエンドポイントから収集された信号を取得し、専用のアルゴリズムを介してデータを実行し、自動管理アクティビティと手動管理アクティビティの両方に情報を提供する出力として実用的な洞察を生成します。

AIOpsツールは、単一のストリームだけに焦点を合わせるのではなく、変更ログやユーザー生成ドキュメントなどの他のデータタイプにリンクすることで、データにコンテキストを挿入できます。そのためには、運用上の考慮事項とビジネス上の考慮事項の両方を考慮に入れて、次のことを可能にする、より深く、よりコンテキストに応じたビューのITインシデントを提供できる必要があります。

  • ITサービスを構成するアップストリームおよびダウンストリームリソースの視覚化
  • 属性に基づいてイベントを相互に関連付けるルールを作成する
  • そして、同じ原因に関連するアラートを相互に関連付ける

マルチサーバー環境では、2セットのサーバー(1つは本番環境、もう1つは開発中)を実行している組織が同じアプリケーションをホストしていることを考慮してください。個々のデバイスからのアラートをコンテキスト化することは、本番サーバーがすぐに注意を払う必要があり、優先順位リストからドロップダウンできるものを識別する唯一の方法です。

IT運用データとビジネスデータの両方を分析するようにAIOpsプラットフォームを構成すると、重要なサービスの稼働を維持するだけでなく、追加されたインテリジェンスから生まれる可能性のあるデータやサービスを収益化する新しい機会を発見します。

AIOpsは複雑さで繁栄します

おそらく、AIOpsの最大の利点と期待は、典型的な現代の企業から生み出された、拡大し続ける分析、ログ、メトリック、イベント、およびデータの世界を取り込む能力です。そして、それが消費するデータが多ければ多いほど、最終的な結果は良くなります。私たちはテクノロジーの歴史の中で転換点にいます。歴史上、テクノロジーがこれほど複雑になったということはありませんが、幸いなことに、現代のテクノロジーでもそれを処理することができます。

次のステップ:

Service-Centric AIOps White Paper


Recommended posts