インフォメーションセンター

AIOps に関する完全ガイド

現在の絶えず変化する IT 環境を過去のツールを使用して管理することはできません。インフラモデルの急速な進化が続いており、管理のための動的なプロセスとテクノロジが求められています。

ビジネス環境は、数十年にわたってこの分野の特徴となってきた静的で予測可能な物理システムから、稼動中に変更および再設定できるソフトウェアデファインドのリソース環境へと移行しています。さらに、ネットワークインフラが進化するにつれ、古いモデルベースのソフトウェアシステムは、有効性を維持するためにますます多くの労力が必要になっているにもかかわらず、どんどん後れを取っています。

このような ITOps (IT 運用) 革命により、デジタルビジネス変革の波が押し寄せ、従来の IT 管理手法の変更を余儀なくさせました。その結果、現在の ITOps 手順およびプロセスが大幅に変更されただけでなく、IT エコシステムの管理も再構築されています。

Gartner 社は、こうした変化の風潮を表現するため、2017 年に AIOps (Artificial Intelligence for IT Operations: AI を活用した IT 運用) という用語を作り出しました。

AIOps は、データサイエンスと機械学習を使用して、ITOps チームが管理対象のシステムのパフォーマンスまたは可用性に影響する問題をリアルタイムで理解できるようにします。

過去数年間で AIOps 市場の分野が急速に拡大する一方で、企業が先を争ってこの新たな革新を理解し、先駆けようとするにつれ、Gartner 社に対する問い合わせは飛躍的に増加しています。

この完全ガイドでは、AIOps、その登場の原動力となった市場とテクノロジの関係、関連する課題にどのように対応できるかについて、知っておくべきことをすべて説明します。

AIOps への道のり

最初に、デジタル変革と、それがどのように AIOps につながるかを理解することが重要です。

デジタル変革には、新しいテクノロジーの実装、クラウドの導入、急速な変化が含まれます。実現するには、重点を開発者およびアプリケーションへとシフトし、イノベーションの速度を上げる必要があります。以下に代表される要素の確保も伴います。

こうした新しいユーザーおよびテクノロジにより、従来のサービス、パフォーマンス管理ツール、戦略は限界に達しています。

デジタル変革を成功させ、現代のほとんどのビジネスが必要とする速度で IT が機能するようになるかどうかは、AIOps にかかっています。したがって、AIOps とは、ITOps でデジタル変革に対応するために必要なパラダイムシフトです。

AIOps とは

AIOps は、「Artificial Intelligence for IT Operations (AI を活用した IT 運用)」の頭字語であり、ITOps (IT 運用) の未来を表します。人間の知能とアルゴリズムインテリジェンスを組み合わせて、企業が日常業務に使用する IT システムのパフォーマンスと状態を完全に可視化します。

AIOps は、機械学習と分析を使用して IT 運用を強化および自動化するハイエンドの多層型テクノロジープラットフォームです。これを使用すれば、さまざまな ITOps デバイスおよびツールから収集したビッグデータを分析し、問題を特定してからリアルタイムで自動的に対応できます。

AIOps では、サイロ化した IT データから移行して、ビッグデータプラットフォーム内部の観察データ (ジョブログや監視システムなど)、エンゲージメントデータ (チケット、イベント、またはインシデント記録内のデータなど) を集約する必要があります。

こうして統合されたデータに対し、AIOps は機械学習と分析を実行します。その結果、継続的なインサイトが得られ、自動化の実装による継続的な改善を実現できるようになります。したがって、AIOps はコア IT 機能に対する CI/CD (継続的な統合と継続的な導入) と考えることができます。

AIOps により、3 つの IT 分野 (自動化、サービス管理、パフォーマンス管理) を結び、継続的なインサイトおよび改善という目標を達成します。新しい高速でハイパースケールの IT 環境には、機械学習およびビッグデータの進歩を活用して人間やレガシーツールの限界を克服できる新しいアプローチが存在すると捉えられています。

AIOps の仕組み

AIOps は、ログイベント、従来の IT 監視、ネットワークパフォーマンスの異常など、企業の既存のデータソースと連携します。こうしたすべてのソースシステムから収集されるデータを数学モデルを使用して処理すれば、多くの時間と労力を要する事前フィルタリングを行うことなく、重要なイベントを自動的に特定できるようになります。

また、新たなアルゴリズムでイベントを分析し、類似する根本的な問題の兆候を示す関連アクティビティの集団を特定できます。アルゴリズムフィルタリングによって、ITOps チームが本来ならば対処する必要があるノイズレベルが大幅に低下するだけでなく、重複 (異なるグループにチケットが不要に送信されて生じる可能性がある) を回避します。

それだけでなく、仮想チームを臨機応変に集め、さまざまなスペシャリストが組織やテクノロジの境界を越えた問題に対処できるようにします。既存のインシデント管理およびチケットシステムは、AIOps の機能を活用し、既存のプロセスに直接統合できます。

さらに、AIOps を利用して自動化を強化し、人間の介入の有無にかかわらず、ワークフローをトリガーできます。また、現在の ChatOps 機能により、診断と修復の通常のコラボレーションプロセスに必要不可欠な構成要素として、既存の自動化機能を利用することも可能です。

機械学習システムの正確性と信頼性がますます高まっているため、十分に理解されている日常的なアクションであれば人間の介入なしにトリガーできるようになっています。これにより、ユーザーに影響が及ぶ前に問題を解決できる可能性があります。

AIOps の要素

AIOps プラットフォームを構成するテクノロジーは次のとおりです。

  • データソース: データソースは広範かつ多様であり、イベント、ログ、指標、チケット、監視、ジョブデータなど、現在はサイロ化されているツールやさまざまな IT 分野からの情報で構成されます
  • ビッグデータ: ビッグデータには、リアルタイム処理を可能にする最新のビッグデータプラットフォームが含まれます。たとえば、Elastic Stack、Hadoop 2.0、一部の Apache テクノロジーなどがあります
  • ルールとパターン: AIOps プラットフォームのルール適用とパターン認識機能では、レバレッジを強化し、データの正常性と規則性を明らかにしながらコンテキストを発見できます。これはドメインに固有の場合も固有でない場合もあります
  • 機械学習 (ML): ML を使用して、新しく導入されたデータおよびアルゴリズム分析の出力に基づき、新しいアルゴリズムの作成や既存のアルゴリズムの変更を自動的に行えます
  • ドメインアルゴリズム: IT 分野の専門知識を活用して、ルールとパターンをインテリジェントに解釈し、エンタープライズのデータおよび目的とする結果に従って適用します。ドメインアルゴリズムにより、非構造化データの関連付け、ノイズの除去、異常に対するアラート、考えられる原因の特定、ベースラインの確立などの IT 固有の目標を達成できます
  • 自動化: 機械学習と AI が生成する結果を使用して、特定された問題および状況に対して自動的に応答を作成および適用します
  • 人工知能 (AI): AI を使用すれば、環境内の未知のものおよび新しいものに適応できます

AIOps の要件と機能

すべての AIOps プラットフォームは、以下の 3 つの機能をエンタープライズに導入するものでなければなりません。

  1. ユーザーリクエスト、重要でない IT システムアラートなどの日常業務を自動化: たとえば、AIOps を利用すると、ヘルプデスクシステムによりユーザーの要求を処理および実行して、リソースを自動的にプロビジョニングできます。サポートするデータと関連指標が通常のパラメータに含まれるため、アラートを評価し、アクションを必要とするかどうかを判断することもできます
  2. 人間よりも迅速かつ正確に重大な問題を認識: IT 担当者は、重要性の低いシステムでの既知のマルウェア攻撃には対応しますが、重要なサーバーで開始されている異常なダウンロードまたはプロセスには対処しない可能性があります。このような脅威を監視または予期していないためです。こうしたシナリオへの AIOps システムの対処は異なります。重要なシステム上のイベントの場合、動作が正常でないという理由から、攻撃または感染の可能性があるとして優先順位を上げます。既知のマルウェアイベントの場合、マルウェア対策を実行することで優先順位を下げます
  3. データセンターチーム間のやり取りを合理化: AIOps は、IT 部門のグループすべてに関連データとインサイトを提供します。AI によってこうした運用を実現できないと、各チームは、データを手動で送信したり、物理的にミーティングを実施したりして、情報を解析および共有する必要があります。AIOps は、企業の大量のリソース指標から、各グループにどのデータを示すかを学習します

AIOps の推進とその必要性

人工知能 (AI) には、人間と同じことを大規模な環境でより迅速かつ適切に実行することが期待されています。AIOps によってデジタル変革の規模、複雑さ、スピードの課題に対応することで、これを ITOps で実現できます。具体的には次のような課題があります。

  1. ITOps がインフラの手動管理で直面する難しさ
  2. 現代の IT 環境にはモバイルサービス、マネージドサービス、非マネージドサービス、クラウドサービス、サードパーティサービス、SaaS 統合などが含まれているため、インフラという用語は不適切だといっても過言ではありません。ビジネスの複雑さを管理するための従来のアプローチが、動的で柔軟な環境には通用しなくなっていることは明らかです。こうした複雑さを人間が手動で監視して管理および追跡することは、ますます難しくなっています。現在の ITOps テクノロジーは手動で管理できる域を超えています。

  3. ITOps で保持する必要のあるデータが増加の一途をたどっている
  4. パフォーマンスの監視により、生成されるアラートやイベントの数が爆発的に増加しています。サービスチケットの量は、モバイルアプリケーション、IoT デバイス、API、デジタルまたはマシンユーザーにより、段階的に増加しています。

  5. インフラの問題への対応スピードを迅速化する必要性
  6. 企業が業務をデジタル化するにつれ、IT はビジネス化しています。テクノロジの「コンシューマライゼーション」により、あらゆる業種でユーザーの期待が変化しました。問題がユーザーエクスペリエンスに影響を及ぼす場合は特に、IT に関するイベントへの対応を即座に行う必要があります。

  7. 開発者の能力と影響力が高まる一方でコア IT の説明責任が不変
  8. DevOps 部門でのアプリケーションレベルの監視については、プログラマの負う責任が重くなっていますが、IT エコシステム全体の健全性に加え、インフラ、アプリケーション、サービス間でのやり取りに関する説明責任は、コア IT の領域です。

  9. コンピューティング能力のネットワークセンターからの移行
  10. サードパーティのサービスとクラウドインフラの導入のしやすさにより、LOB (基幹業務) 部門が IT アプリケーションとソリューションを構築できるようになりました。管理と予算の対象は IT のエッジへとシフトしています。今や企業は、より多くのコンピューティング能力をコア IT の外部から調達できます。

AIOps と現在のツールとの統合

AIOps では、既存のプロセスおよびツールを連携させて、有益な情報、機能、インサイトを統合できます。企業では監視ツールを使用しますが、その領域、種類、目的はさまざまです。各ツールは、特定の業務、チーム、または会社にとって重要なものですが、他の関係者がその価値を利用することができません。

このため、労力の要するツールの合理化を図り、万能型のソリューションで個々のニーズに対応するのではなく、AIOps によりドメイン、チーム、ツールにわたるシームレスな可視化を実現して、特定のツールの活用を促します。

同様に、AIOps では実際の実用的なインシデントのみを作成して重複を回避することによって、IT サービスマネジメント (ITSM) を実現できます。さらに、段階的な ITIL (IT Infrastructure Library) の性質が原因で生じる ITSM に関するユーザーの不満を解消します。

また、AIOps は自動化をもたらします。オーケストレーションとランブックを統合して、オペレーターのために直接役立つ完全自動化または部分自動化を実現します。IT 企業は、長年にわたって大規模な自動化ソリューション用のライブラリを開発してきたため、ライブラリを正しい条件下でのみトリガーする必要があります。AIOps はこの動作を実現するだけでなく、リスクを最小限に抑え、既存の自動化への投資から最大限の価値を引き出します。

AIOps の対象

  1. ビッグデータと IT に大きく依存している複雑な環境の大規模企業
  2. 現在、複数のテクノロジーを活用する大規模な IT 環境を抱えている企業は、規模と複雑さの問題に直面しています。この問題を IT に大きく依存するビジネスモデルと組み合わせた場合、AIOps は確実に企業の成功に大きな違いをもたらします。こうした企業の業種は多岐にわたりますが、規模と、変化の速度が加速している点は共通しています。ビジネスの俊敏性に対するニーズが IT の俊敏性の需要を高めているのです。

  3. クラウドコンピューティング
  4. クラウドコンピューティングへの移行には課題が伴います。問題の 1 つはスケーリングです。これに起因して、IT 全体をクラウドに移行することが不可能または望ましくない場合があれば、IT インフラのさまざまな提供形態を組み込むハイブリッドモデルの運用が困難な場合もあります。

    AIOps を利用して、すべてのインフラタイプを包括的に可視化し、変化が速すぎて文書化できない関係を運用担当者が理解できるよう支援することで、ハイブリッドクラウドプラットフォームの運用に関するリスクの大部分を取り除けます。

  5.  DevOps チーム
  6. DevOps モデルを導入済み、または導入中の企業では、関与する役割間の連携を維持することが困難な場合があります。開発システムと運用システムを AIOps モデルに直接統合すれば、連携に関して発生する可能性がある障害の大部分を解消することができます。

    開発チームに IT 環境の状態をより適切に理解してもらう必要があります。運用チームにも、開発者がいつどのように実稼動環境への変更または導入を予定しているかを十分に把握してもらう必要があります。それぞれが全体像をつかむことが、プロジェクトの全体的な成功をもたらし、俊敏性と応答性の実現につながります。

  7. デジタル変革
  8. デジタル変革の取り組みには多くの定義がありますが、共通するのは俊敏性と速度の要件です。厳密にいえば、これはビジネス要件ですが、ボトルネックになるのを避け、より広範な目標を達成するには、ビジネスの速度での IT 運用が必要です。AIOps により、大半のデジタル変革プロジェクトの成功に必要な IT サポートを妨げるおそれのある障害を取り除けます。

AIOps の利点

AIOps プラットフォームが適切に実装されていれば、IT スタッフが日常的なアラートに費やす時間と注意が少なくなります。IT スタッフが AIOps プラットフォームを教育することで、AIOps は機械学習とアルゴリズムを使用して進化します。その後、獲得した知識を徐々に再利用して、ソフトウェアの行動と有効性を改善します。

AIOps ツールは休息する必要がなく、監視を継続的に実行します。人間の担当者は、重大で複雑な問題やビジネスの安定性とパフォーマンスを高める取り組みに集中できます。

AIOps システムは、企業の複数の業務、リソース、サービスの因果関係を観測し、異種のデータソースを照合およびクラスタ化できます。これらの機械学習および分析機能により、有益な根本原因の分析を実行できるようになり、困難で独特な問題のトラブルシューティングおよび修復能力が高まります。

AIOps は、IT グループ間および IT 部門と他の事業部門間のワークフロー活動とコラボレーションを改善します。チームは、調整されたレポートとダッシュボードを使用して、要件とタスクをすばやく理解できます。また、他のグループが知っておくべきことを把握することなく、他のグループと連携できます。

AIOps によってノイズや邪魔になるものが取り除かれるため、IT 担当者は無関係なアラートを気にせずに重要な問題に集中できます。

AIOps は複数のデータリソースの情報を関連付けます。これにより、サイロが排除されるだけでなく、ネットワーク、コンピューティング、ストレージ (仮想、物理、クラウド) といった IT 環境全体が包括的に可視化されます。

サービス所有者とスペシャリストのコラボレーションがスムーズになるため、診断、分析、解決時間が短縮され、エンドユーザーに対するサービスの中断を最小限に抑えられます。

AIOps の欠点

基盤となる AIOps テクノロジは比較的成熟していますが、これらのテクノロジを開発し組み合わせて実用化するという点では、まだ長い道のりがあります。AIOps には次のような欠点があります。

  • AIOps の効果は、その教育に使用するアルゴリズムと提供するデータによって決まる。したがって、プログラム内容以上のことには対応できない
  • AIOps プラットフォームの実装、管理、保守に必要な労力と時間は相当量になる場合がある
  • AIOps システムは、多様なデータソースだけでなく、データの保持、保護、保管に依存する
  • AIOps によって信頼が要求されるツールには、一部の企業にとって好ましくない要素が含まれる可能性がある。その理由は、AIOps ツールが自律的に動作するには、ターゲット環境内の変更に正確に従い、関連データを収集して保護し、正しい結論を形成して、アクションに優先順位を付け、最後に自動化された適切な手段を講じる必要があるため

企業での AIOps の導入

従えば必ず成功するような明確で汎用的なロードマップはありません。ただし、開始にあたって以下の一般的な指針が役に立ちます。

  • 今すぐ機械学習と人工知能の基本を十分に理解する
  • IT チームが担当する中で最も時間のかかるタスクを洗い出し、自動化を適用できる反復的な要素に注目する
  • 小規模から始め、範囲を広げる。AIOps で迅速に解決できる最優先の問題を見つける
  • できる限り多くのデータタイプをシステムに提供する
  • AIOps 環境の有効性を測定するのに役立つ指標を考案する

現代の IT 環境で AIOps が適合する領域

AIOps を初めて検討する際、既存のツールカテゴリにどのように適合するのか、すぐにはわからない場合があります。AIOps は、現在の監視、オーケストレーション、サービスデスク、またはログ管理ツールに代わるものではありません。むしろ、あらゆる領域やツールとの接点を持ち、そのすべての情報を統合および吸収します。また、すべてのツールを同時に把握するための有益なアウトプットを提供します。

こうしたツールは単体でも価値がありますが、単体で動作している状態では、適切な情報に適切なタイミングでアクセスすることが困難です。AIOps は、部分的な観点をさまざまに組み合わせて、ITOps チームが把握すべき全体像を包括的に理解できるようにするための柔軟なアプローチです。

AIOps は ITOps のまったく新しい形態ではありますが、ビッグデータと機械学習の応用はこれが初めてではありません。株式仲買業では、手動取引から機械取引への移行時に同様の ML アプローチを導入しました。ソーシャルメディアも、Google Maps、Yelp、Waze などのアプリケーション、または eBay や Amazon などのオンライン市場で ML と分析を長く使用しています。

こうした技術は、変化する状況やユーザーのカスタマイズに対するリアルタイムでの対応が必要な環境で、確実かつ広範囲に役立つことが証明されています。

AIOps での AI の導入は、機械学習と比較して前途有望です。現在は、シンプルな自動化を使用するか、自動化を ML と組み合わせることで、差し迫ったユースケースに対応できます。AI とその新しいユースケースは今もなお進化しています。いずれにせよ、人間の行動のモデリングを開始する前に、既存の ITOps で強力な AIOps 基盤を構築することが不可欠です。

ITOps 担当者は、仕事の性質上、AIOps 環境への適応に時間がかかります。その責任は、現状を維持し、企業のインフラを安定させることにあります。しかし、AIOps を幅広く応用することが新たな傾向となっているため、より多くの ITOps 部門が新しい AIOps テクノロジおよび戦略に迅速に適応しなければならなくなるでしょう。

結論

この AIOps の完全ガイドは、お客様の企業にとって AIOps が適合するかどうか、その組み込みを開始する時期、使用方法を確認するのに役立ちます。また、それ以上に、AIOps の進展について常に最新情報を把握しておくことをお勧めします。さまざまな兆候が、この革新的なテクノロジーが成長段階にあることを示唆しています。

 

AIOps を組み込む必要がある場合は、ベリタスがお手伝いします。今すぐお問い合わせください。担当者からご連絡を差し上げます。

 

業界をリードするアドバイザリ企業であり、AIOps を提唱した Gartner 社から、ベリタスは 17 回にわたりデータセンターのバックアップとリカバリ部門のリーダーに選出されています。以下のレポートをご確認ください。また、Veritas NetBackup の詳細については、こちらをご覧ください。

NetBackup IT Analytics は、すべての主要なストレージ、バックアップ、仮想インフラ環境に関する統合的なインサイトを、オンプレミスとマルチクラウドの環境を問わず提供する唯一の IT 分析ソフトウェアです。