このブログは、今後のOpsramp / 451ウェビナーと連動して実行されます。 IT運用の成熟度の4つの段階。
記事上で:
- インフラストラクチャ監視ツールを適応させる必要がある理由を学ぶ
- 新しいインテリジェントなインフラストラクチャ監視に関する初期の問題
- インテリジェントなインフラストラクチャ監視ツールのしくみ
インフラストラクチャ監視システムは、過去数年間で大きな変化を遂げています。クラウドコンピューティング、IoTとエッジコンピューティング、モバイルアプリ、SaaSアプリが普及する前は、従来はかなりサイロ化されていましたが、その慣行はかなり静的でした。
IT管理者は、いくつかのツールから一連の標準メトリックに関するデータを取得する必要がありました。
- アプリケーション–パフォーマンス(応答時間やエラー率など)と可用性
- オペレーティングシステム–使用率、OSサービスの可用性
- セキュリティ–パッチコンプライアンス、侵入試行、MTTD、MTTR
- ネットワーク–帯域幅の消費、遅延、スループット、および可用性。
- ストレージ–容量、IOPS、レイテンシー
- ハードウェア– CPU、メモリ、ディスク使用量
このデータのほとんどは企業ファイアウォール内のシステム(ITが完全に制御でき、変更頻度の低いシステム)からのものであるため、これを行うのはかなり簡単でした。
現在、企業はITをクラウドで実行し、内部データセンターを維持しており、複数のクラウド環境を実行している可能性があります。 従業員は完全に従事しています シャドーITつまり、データとアプリケーションの20%から50%がレーダーの下を飛んでおり、パフォーマンスとセキュリティのリスクについて管理も監視もされていません。同様に、発見して分析するデータが指数関数的に増えています。
幸い、機械学習を適用して動的で高度に分散されたIT資産の混乱を制御するのに役立つ新しいテクノロジーソリューションが導入されました。 最新のインフラストラクチャ監視システムは、多くの環境、テクノロジー、ツールセットを調べて、重大な問題とその根本原因をはるかに迅速に特定できます。
機械学習モニタリングテクノロジーの出現
業界によると、2016年頃に機械学習がモニタリングに適用されるようになりました。 ナンシー・ゴーリング、451Researchのシニアリサーチアナリスト。以下のこのビデオでは、ゴーリングが、現代のIT運用組織のコア特性としてのインテリジェントモニタリングの台頭について説明しています。
2019年の451リサーチレポート、「ITOpsの進化」IT運用の4つの段階である、従来型、成熟型、最新型、および将来について説明します。組織が最新フェーズに進むにつれ、IT運用プラットフォームにAIと機械学習機能を追加することが重要なイネーブラーです。
当時、このタイプのソフトウェアのユーザーエクスペリエンスは、しばしば呼ばれていました。 AIOps、素晴らしかった、と彼女は言います。 「それは難しかった。ユーザーは、機械学習を使用するためのメトリックと、場合によってはアルゴリズムを選択する必要があり、エラーが発生していました。」の次の段階で AI主導のソフトウェア開発、ベンダーは機械学習を適用して、すべての運用指標を分析しました。しかし、これはより多くのアラートと情報過多を生み出しました。
最後に、ツールがアラートデータを重大、メジャー、マイナーなどの重大度カテゴリにグループ化し、それらをコンテキストが豊富なインシデントに関連付けると、状況が明らかになり始めました。 最新のステップは因果関係でした、とゴーリング氏は言います。「システムはトポロジーのようなものを調べ始め、時間以外のデータに相関関係があることを確認しました。」
「インテリジェントな監視ツールを使用して、問題の原因を正確に特定し、適切な自動化を開始して問題を修正します。」
-ナンシー・ゴーリング、 シニアアナリスト、アプリケーションおよびインフラストラクチャパフォーマンス、451 Research
インテリジェントな監視:IT運用の卓越性への道のり
積極的であることは、パフォーマンスの高いIT運用組織の最大の特徴の1つであると、 Digital EnterpriseJournalによるレポート ;調査によると、パフォーマンスの高い組織の79%は、他の組織の39%と比較して、パフォーマンスの問題をプロアクティブに検出できます。
人工知能とインテリジェントモニタリングは、アルゴリズムを使用してこれを推進するのに役立ちます。 推論モデル 同様の発信元または動作を持つアラートを相互に関連付け、重複排除、または抑制するため。と インテリジェントなインフラストラクチャの監視 、組織はマシンデータをはるかに高速にフィルタリングできるため、ユーザーは有効なアラートのみを受信し、重複を排除できます。
アラートデータがeコマースサイトなどの特定のビジネスサービスに接続されている場合、オペレーターはインシデントの解決に優先順位を付けることもできます。この分野での新しい開発は、集合知の概念であるとGohring氏は言います。この概念では、SaaSベンダーが顧客ベース全体のデータを監視して、システムによるより正確な提案を通知できるパターンを確認しています。
からのROI インテリジェントなインフラストラクチャの監視は、IT環境における自動化のベストプラクティスの理解の進歩に依存しています。 「インテリジェントな監視ツールを使用して、問題の原因を正確に特定し、適切な自動化を開始して問題を修正します」とGohring氏は言います。
次のステップ:
- 申し込む OpsRampブログへ!
- について学ぶについて学びます。。
- OpsRampがマルチクラウド環境を監視する方法 .