Centro de informações

O que é AIOps? O guia definitivo

É impossível gerenciar o cenário de TI dinâmico e em constante mudança de hoje em dia com ferramentas ultrapassadas. Os modelos de infraestrutura estão em rápida e contínua evolução, exigindo tecnologias e processos dinâmicos de gerenciamento.

O ambiente corporativo está deixando de ser caracterizado por sistemas estáticos e previsíveis, que definiram a TI por décadas, e se tornando um ambiente de recursos definidos por software que muda e se reconfigura em instantes. Além disso, com a evolução da infraestrutura de rede, os sistemas de software com base em modelos exigem cada vez mais esforço para manter sua eficácia, mas, assim mesmo, ficam ultrapassados cada vez mais rápido.

Devido a essa revolução nas operações de TI (ITOps), a transformação dos negócios digitais exigiu mudanças nas técnicas tradicionais de gerenciamento de TI. Consequentemente, há uma mudança significativa nos procedimentos e processos atuais de ITOps, bem como uma reestruturação no gerenciamento de ecossistemas de TI.

A Gartner definiu o termo inteligência artificial para operações de TI (AIOps) em 2017, a fim de refletir a essência dessas mudanças.

A AIOps usa ciência de dados e aprendizagem de máquina para oferecer às equipes de ITOps uma compreensão em tempo real dos problemas que estão afetando o desempenho ou a disponibilidade dos sistemas sob sua responsabilidade.

Nos últimos anos, a categoria de mercado AIOps explodiu, e o número de consultorias atendidas pela Gartner aumentou exponencialmente conforme as empresas se esforçaram para entender esse novo desenvolvimento e se preparar para ele.

Este guia definitivo aborda tudo o que você precisa saber sobre AIOps, a dinâmica de mercado e tecnologia que impulsiona seu desenvolvimento e como ela pode solucionar esses desafios.

O caminho até AIOps

Primeiramente, é fundamental entender a transformação digital e como ela seu origem à AIOps.

A transformação digital abrange a implementação de novas tecnologias, a adesão aos serviços em nuvem e mudanças em ritmo acelerado. Ela requer uma mudança no foco dos desenvolvedores e aplicativos e um aumento na velocidade das inovações. Ela envolve ainda a aquisição do seguinte:

  • Dispositivos de Internet das coisas (IoT)
  • Novos agentes digitais para fazer associações usuários-máquina
  • Interfaces de programação de aplicativos (APIs)

Todos esses novos usuários e novas tecnologias estão levando os serviços tradicionais e as ferramentas e estratégias de gerenciamento de desempenho ao limite.

Uma transformação digital bem-sucedida depende da AIOps para capacitar a TI para funcionar na velocidade que a maioria das empresas modernas exige. Portanto, AIOps descreve a mudança de paradigma necessária para lidar com a transformação digital em ITOps.

O que é AIOps?

AIOps é um acrônimo de “Artificial Intelligence for IT Operations”, ou seja, inteligência artificial para operações de TI. Ela é o futuro das operações de TI (ITOps). Essa tecnologia combina inteligência humana e algorítmica para oferecer visibilidade total sobre o desempenho e estado dos sistemas de TI, dos quais as empresas dependem para operar diariamente.

AIOps se refere às plataformas de tecnologia de alto nível e com várias camadas que melhoram e automatizam as operações de TI usando aprendizagem de máquina e análise de dados para processar os grandes volumes de dados coletados de diferentes dispositivos e ferramentas de ITOps e, assim, poder identificar e solucionar problemas automaticamente e em tempo real.

A AIOps requer uma transição do modelo de dados de TI em silos para dados agregados de observação (por exemplo, logs de tarefas e sistemas de monitoramento) e dados sobre engajamento (como os dados encontrados em um tíquete, evento ou registro de incidente) dentro de uma plataforma de big data.

Então, a AIOps implementa aprendizagem de máquina e análise de dados à combinação desses dados. O resultado é um fluxo contínuo de insights capaz de impulsionar melhorias contínuas por meio da implementação de automação. Portanto, você pode interpretar a AIOps como integração e implementação contínuas (CI/CD) para as principais funções de TI.

A AIOps une três disciplinas de TI (automação, gerenciamento de serviços e gerenciamento de desempenho) para atingir seus objetivos e possibilitar insights e melhorias contínuas. É o reconhecimento de que, nos novos ambientes de TI, acelerados e em enormes escalas, existe uma nova abordagem que pode se beneficiar dos avanços em aprendizagem de máquina e big data para superar as limitações humanas e de ferramentas legadas.

Como a AIOps funciona

A AIOps funciona com as fontes de dados existentes de uma organização, incluindo eventos de log, monitoramento tradicional de TI, anomalias no desempenho da rede, entre outros. Os dados coletados de todos esses sistemas de origem são processados usando um modelo matemático que identifica automaticamente eventos significativos sem precisar da realização prévia de filtragens manuais trabalhosas.

Outra camada de algoritmos analisa os eventos e identifica clusters de atividades relacionadas que são sintomas de um problema subjacente semelhante. A filtragem algorítmica reduz significativamente o nível de ruído que as equipes de ITOps precisariam enfrentar e também evita as duplicações que podem ocorrer por conta do roteamento redundante de tíquetes para diferentes grupos.

Em vez disso, você pode montar equipes virtuais em instantes e permitir que diferentes especialistas trabalhem no mesmo problema, ultrapassando os limites organizacionais ou tecnológicos. Os sistemas existentes de gerenciamento de incidentes e geração de tíquetes podem aproveitar os recursos de AIOps e se integrar diretamente aos processos atuais.

A AIOps aprimora ainda mais a automação. Ela permite o acionamento de fluxos de trabalho com ou sem intervenção humana. Os recursos atuais de ChatOps disponibilizam os recursos de automação existentes como uma parte essencial do processo colaborativo normal de diagnóstico e correção.

Com o aumento incessante da precisão e confiabilidade dos sistemas de aprendizagem de máquina, agora é possível iniciar ações bem compreendidas ou de rotina sem intervenção humana, o que possibilita resolver problemas antes que eles afetem os usuários.

Os elementos da AIOps

As tecnologias que compõem as plataformas AIOps estão listadas abaixo.

  • Fontes de dados. São amplas e diversas. Elas vêm de ferramentas e disciplinas de TI atualmente em silos, incluindo eventos, logs, métricas, tíquetes, monitoramento, dados de tarefas, etc.
  • Big Data. Inclui as plataformas modernas de big data que permitem processamento em tempo real. Alguns exemplos são Elastic Stack, Hadoop 2.0 e algumas tecnologias Apache.
  • Regras e padrões. A aplicação de regras e o reconhecimento de padrões da plataforma de AIOps impõem aproveitamento e podem descobrir contextos enquanto revelam normalidades e regularidades dos dados. Elas podem ou não ser específicas para o domínio.
  • Aprendizagem de máquina (ML). A aprendizagem de máquina pode automaticamente criar novos algoritmos ou alterar os existentes com base nos resultados de dados introduzidos recentemente e análises algorítmicas.
  • Algoritmos de domínio. Aproveitam a expertise da TI sobre domínios para interpretar de modo inteligente regras e padrões e aplicá-los conforme determinado pelos dados e resultados desejados pela empresa. Os algoritmos de domínio permitem que as organizações atinjam objetivos específicos em TI, como correlacionar dados não estruturados, eliminar ruídos, alertar sobre anormalidades, identificar causas prováveis e estabelecer linhas de base.
  • Automação. Usa os resultados gerados pela aprendizagem de máquina e pela inteligência artificial para automaticamente criar e aplicar respostas para situações e problemas identificados.
  • Inteligência artificial (AI). A AI pode se adaptar a elementos desconhecidos e novos em um ambiente.

Os requisitos e recursos da AIOps

Todas as plataformas de AIOps devem oferecer à sua empresa os três recursos enumerados a seguir.

  1. Automatizar práticas de rotina, como solicitações de usuários ou alertas não críticos do sistema de TI. Por exemplo, a AIOps pode capacitar sistemas de helpdesk para processar e atender às solicitações dos usuários e provisionar recursos automaticamente. Os sistemas também poderiam avaliar os alertas e identificar se eles exigem alguma ação, pois os dados de suporte e as métricas relevantes se enquadram nos parâmetros normais.
  2. Reconhecer problemas sérios mais rápido e com maior precisão que os humanos. Os funcionários de TI podem solucionar eventos de malware conhecidos em sistemas não críticos, mas não perceber a inicialização de downloads ou processos incomuns em um servidor crítico, pois não estão monitorando a ocorrência dessa ameaça nem preparados para lidar com ela. Os sistemas de AIOps abordam essas situações de outra maneira. Eles priorizam os eventos que ocorrem em sistemas críticos, considerando-os possíveis ataques ou infecções já que um comportamento anormal foi identificado, e tratam com menos urgência eventos de malware por meio da execução de recursos antimalware.
  3. Simplificar as interações entre as equipes de data center. A AIOps oferece dados e insights relevantes a todos os grupos de TI funcional. Sem essas operações possibilitadas por AI, as equipes precisam analisar e compartilhar as informações por meio do envio manual de dados ou de reuniões presenciais. A AIOps deve aprender quais dados devem ser exibidos para cada grupo a partir do grande pool de métricas de recursos da organização.

O que impulsiona a AIOps e por que você precisa dela?

A promessa da inteligência artificial (AI) é executar as mesmas tarefas desempenhadas por humanos, mas mais rápido, melhor e em grande escala. A AIOps permite fazer isso por sua ITOps ao solucionar os desafios relacionados ao tamanho, à complexidade e à velocidade da transformação digital. Entre esses desafios, estão:

  1. A dificuldade que a ITOps enfrenta ao gerenciar manualmente sua infraestrutura
  2. O termo infraestrutura é quase um equívoco, já que os ambientes modernos de TI incluem dispositivos móveis, nuvens gerenciadas ou não, serviços de terceiros, integrações com SaaS e muito mais. É evidente que as abordagens tradicionais para gerenciar as complexidades dos negócios não se aplicam mais de forma eficaz em ambientes dinâmicos e elásticos. Gerenciar e rastrear essa complexidade usando a supervisão humana manual fica cada vez mais difícil. A tecnologia atual de ITOps vai além do gerenciamento manual.

  3. A ITOps precisa manter uma quantidade cada vez maior de dados
  4. O monitoramento de desempenho gera números cada vez maiores de alertas e eventos. Os volumes de tíquetes de serviço aumentaram devido à introdução de aplicativos móveis, dispositivos de IoT, APIs e usuários digitais ou de máquinas.

  5. A necessidade de solucionar problemas de infraestrutura em velocidades cada vez maiores
  6. Conforme as organizações digitalizam suas operações, a TI se transforma na empresa. A “consumerização” da tecnologia mudou as expectativas dos usuários em todos os setores. Atualmente, as reações aos eventos de TI precisam ser imediatas, especialmente quando os problemas afetam a experiência do usuário.

  7. Os desenvolvedores gostam de ter mais poder e influência, mas a responsabilidade ainda é da TI central
  8. Nas organizações de DevOps , os programadores assumiram mais funções relacionadas ao monitoramento no nível do aplicativo, mas a responsabilidade pela integridade de todo o ecossistema de TI e da interação entre infraestrutura, aplicativos e serviços continua sendo da TI central.

  9. Mover mais poder de processamento do centro da rede
  10. A facilidade de adotar serviços de terceiros e uma infraestrutura na nuvem possibilitou que as funções da linha de negócios criassem seus próprios aplicativos e soluções de TI. O controle e o orçamento estão migrando para as bordas da TI. Agora, as empresas podem adicionar mais poder de processamento vindo de fora da TI central.

Como integrar AIOps a suas ferramentas atuais

É possível integrar a AIOps aos processos e ferramentas existentes, juntando informações, recursos e insights úteis. As empresas usam diversas ferramentas de monitoramento, localizadas em diferentes áreas, para diferentes propósitos. Cada ferramenta é útil para uma função, equipe ou empresa específica, mas não tem o mesmo valor para outras partes interessadas.

Por isso, em vez de envolver iniciativas trabalhosas de racionalização de ferramentas para tentar forçar uma solução única que atende a necessidades individuais a servir para tudo, a AIOps permite que ferramentas específicas prosperem ao promover visibilidade perfeita entre domínios, equipes e ferramentas.

De modo semelhante, a AIOps também auxilia o gerenciamento de serviços de TI (ITSM) ao garantir que somente incidentes reais e acionáveis sejam criados e evitando duplicações. A AIOps soluciona e elimina muitas das frustrações dos usuários com ITSM devido à natureza sequencial do IT Infrastructure Library (ITIL).

A AIOps também integra a automação. Ele integra orquestração e executa livros, disponibilizando-os diretamente aos operadores como automação total ou parcial. As organizações de TI desenvolveram grandes bibliotecas de soluções de automação ao longo dos anos; por isso, precisam garantir que somente as condições corretas as acionem. Além de garantir isso, a AIOps também minimiza os riscos e maximiza o valor dos investimentos existentes em automação.

Quem está usando AIOps?

  1. Empresas grandes e complexas que dependem fortemente de big data e TI
  2. Hoje em dia, as empresas com ambientes de TI substanciais que incluem vários tipos de tecnologia enfrentam problemas de escala e complexidades. Ao combinar esses problemas a modelos de negócios que dependem muito da TI, a AIOps certamente fará um diferença significativa para o sucesso da empresa. Embora operem em diferentes setores, esses tipos de organizações compartilham uma escala semelhante e uma taxa de mudanças em constante aceleração. A necessidade de ter agilidade nos negócios cria mais demanda para agilidade na TI.

  3. Computação em Nuvem
  4. Mudar para a computação em nuvem traz alguns desafios. Um desses problemas é o escalonamento; talvez uma migração da TI em grande escala para a nuvem não seja possível ou a melhor opção. Pode ser desafiador operar modelos híbridos que incorporam diferentes formas de distribuição da infraestrutura de TI.

    A AIOps ajuda a eliminar muitos dos riscos de operar uma plataforma de nuvem híbrida ao distribuir uma visão holística em todos os tipos de infraestrutura e auxiliar os operadores na compreensão de relações que mudam rápido demais para serem documentadas.

  5.  Equipes de DevOps
  6. As empresas que já têm ou estão no processo de adotar um modelo de DevOps podem ter dificuldade para manter o alinhamento entre as várias funções envolvidas. A integração direta dos sistemas de desenvolvimento e operação em um modelo de AIOps pode suavizar muitos dos problemas de atrito de interfaces que poderiam ocorrer.

    Suas equipes de desenvolvimento devem ter uma compreensão melhor do estado do ambiente de TI. Além disso, suas equipes de operações devem ter visibilidade total de como e quando os desenvolvedores planejam fazer alterações ou implementações na produção. Ter essa visão holística garante o sucesso geral de seus projetos e a obtenção de agilidade e responsividade.

  7. Transformação Digital
  8. Existem muitas definições de iniciativas de transformação digital, mas um fator comum é a exigência por agilidade e velocidade. Embora, tecnicamente, esse seja um requisito de negócios, a TI precisa operar na velocidade dos negócios para evitar congestionamentos para que objetivos mais amplos sejam atingidos. A AIOps ajuda a eliminar grande parte do atrito que pode impedir a TI de oferecer o suporte do qual a maioria dos projetos bem-sucedidos de transformação digital precisa.

Os benefícios da AIOps

Com a implementação adequada, as plataformas de AIOps reduzem o tempo e a atenção gastos pela equipe de TI com alertas rotineiros, que fazem parte do cotidiano. A equipe de TI pode ensinar às plataformas de AIOps, que, posteriormente, poderão evoluir usando aprendizagem de máquina e algoritmos. Elas poderão então reutilizar os conhecimentos adquiridos ao longo do tempo para melhorar o comportamento e a eficiência do software.

As ferramentas de AIOps executam monitoramento contínuo sem precisar descansar ou dormir. Isso libera os funcionários, permitindo que se concentrem em problemas sérios e complexos e iniciativas para melhorar a estabilidade e o desempenho da empresa.

Os sistemas de AIOps podem identificar relações causais nos vários tipos de operações, recursos e serviços de uma organização, agrupando e criando clusters com fontes de dados diferentes. Esses recursos de aprendizagem de máquina e análise de dados permitem que os sistemas executem análises úteis de causa principal capazes de acelerar sua capacidade de solução de problemas e corrigir problemas difíceis ou incomuns.

A AIOps melhora as atividades do fluxo de trabalho e a colaboração entre os grupos de TI, bem como a colaboração entre o departamento de TI e outras unidades de negócios. As equipes podem entender rapidamente suas exigências e tarefas usando relatórios e painéis personalizados. Elas também podem trabalhar em intersecção sem precisar aprender tudo o que os outros grupos sabem.

A AIOps elimina o ruído e as distrações, permitindo que os funcionários de TI dediquem sua atenção a problemas essenciais em vez de perder tempo com distrações causadas por alertas irrelevantes.

A AIOps ajuda a correlacionar informações de vários recursos de dados, o que, além de eliminar os silos, também oferece uma visão holística de todo o ambiente de TI, incluindo rede, computação e armazenamento (virtual, físico e na nuvem).

Assim, ela permite uma colaboração livre de atritos entre os especialistas e os proprietários do serviço. Isso reduz o tempo de diagnóstico, análise e resolução, minimizando a interrupção no trabalho dos usuários finais.

As desvantagens da AIOps

Embora as tecnologias subjacentes da AIOps sejam relativamente maduras, ainda há um longo caminho a percorrer no que se refere à criação e combinação delas para o uso prático. Veja abaixo algumas desvantagens:

  • A qualidade da AIOps depende da qualidade dos algoritmos ensinados e dos dados recebidos. Portanto, ela não pode ir além dos limites de sua programação.
  • A quantidade de esforço e tempo necessários para implementar, gerenciar e manter as plataformas de AIOps pode ser significativa.
  • Os sistemas de AIOps dependem de diversas fontes de dados, bem como da retenção, da proteção e do armazenamento dos dados.
  • A AIOps exige confiança em ferramentas, um fator que pode não agradar algumas empresas. Isso acontece porque, para que as ferramentas de AIOps atuem de modo autônomo, elas precisam seguir as alterações feitas no ambiente de destino com precisão, coletar e proteger os dados relevantes, formar conclusões corretas, priorizar ações e, por fim, tomar as medidas automatizadas adequadas.

Como implementar AIOps em sua organização

Não existe uma receita universal que possa ser seguida para garantir o sucesso. No entanto, algumas das dicas gerais abaixo podem ajudar você a começar.

  • Familiarize-se com os aspectos básicos da aprendizagem de máquina e da inteligência artificial agora mesmo.
  • Identifique as tarefas mais demoradas que a equipe de TI de sua empresa realiza atualmente. Preste atenção a elementos repetitivos que poderiam ser desempenhados por uma automação.
  • Comece aos poucos e vá expandindo. Identifique quais são os problemas mais urgentes que a AIOps poderia resolver rapidamente.
  • Alimente o sistema com a maior quantidade possível de tipos diferentes de dados.
  • Desenvolva métricas para ajudar a medir a eficácia de seu investimento em AIOps.

Onde a AIOps se encaixa no ambiente de TI moderno

À primeira vista, talvez você não consiga identificar onde a AIOps se encaixa entre suas categorias de ferramentas existentes. O motivo disso é que ela não substitui as ferramentas atuais de monitoramento, orquestração, ServiceDesk ou gerenciamento de logs. Em vez disso, ela atua em intersecção com todos os diferentes domínios e ferramentas, integrando e consumindo informações obtidas de todos eles. Além disso, ela também oferece resultados úteis para oferecer um retrato sincronizado de cada ferramenta.

Separadamente, cada uma dessas ferramentas tem sua utilidade. No entanto, acessar as informações certas na hora exata é difícil se elas permanecem desconectadas umas das outras. A AIOps apresenta uma abordagem flexível para reunir todas as informações parciais e proporcionar uma compreensão abrangente da situação geral – o que é fundamental que suas equipes de ITOps saibam.

Embora a AIOps represente uma ruptura radical com a ITOps, ela não é a primeira aplicação de big data e aprendizagem de máquina. Corretores da bolsa de valores implementaram abordagens semelhantes de ML ao migrar de transações manuais para automatizadas. As redes sociais já utilizam ML e análise de dados há bastante tempo em aplicativos como Google Maps, Yelp e Waze, e também lojas online, como eBay e Amazon.

Essas técnicas se mostraram confiáveis e amplamente úteis em ambientes que exigem respostas em tempo real a condições que mudam constantemente e personalizações de usuários.

A adoção da AI na AIOps é promissora em comparação com a aprendizagem de máquina. Atualmente, é possível solucionar casos de uso urgentes usando automações simples ou combinando automação e ML. A evolução da AI e de seus novos casos de uso ainda está em andamento. Independentemente disso, é fundamental estabelecer uma base forte de AIOps na ITOps em seu estado atual antes de começar a modelagem de comportamentos humanos nela.

Os funcionários de ITOps têm uma adaptação lenta aos ambientes de AIOps devido à natureza conservadora de seu trabalho. É responsabilidade deles garantir que tudo esteja funcionando e garanta estabilidade à infraestrutura da organização. No entanto, devido às tendências emergentes de aplicativos de AIOps e sua rápida propagação, cada vez mais equipes de ITOps precisarão se adaptar logo às novas tecnologias e estratégias de AIOps.

A conclusão?

Este guia definitivo de AIOps ajudará você a identificar se essa tecnologia é adequada para sua empresa, quando você deve começar a incorporá-la e como você pode utilizá-la. Além disso, é recomendável se manter informado sobre o progresso da AIOps. Vários sinais indicam que essa tecnologia inovadora está destinada a crescer.

 

Deseja incorporar a AIOps em sua organização? A Veritas pode ajudar. Entre em contato conosco agora mesmo para receber uma ligação de um de nossos representantes.

 

A Gartner, que originou a AIOps e atua como referência no assunto na linha de frente do setor, nomeou a Veritas como líder em backup e recuperação de data centers 17 vezes. Consulte o relatório abaixo e saiba mais sobre o Veritas NetBackup aqui.

O NetBackup IT Analytics é o único software de análise de dados de TI que oferece insights unificados para todas as principais infraestruturas virtuais, de armazenamento e de backup em ambientes locais e multinuvem.