Monitoração Zero-Touch

hello world!
Monitoração Zero-Touch

O conceito de soluções Zero-touch não é novo. Essas soluções envolvem o uso de automações, regras de negócios e, mais recentemente, IA (Inteligência Artificial) combinados de tal forma que uma aplicação, máquina ou sistemas funcionem ou mantenham-se funcionando sem intervenção humana.

Exemplos, fora do ambiente de TI, variam desde simples sistemas de iluminação e câmeras de vigilância que ativam-se com movimento, até carros autônomos.

Em monitoração de TI, o conceito de zero-touch tem sido discutido mais recentemente com o surgimento e a adoção de soluções de AIOps (Inteligência Artificial para Operação de TI). Segundo o GartnerAIOps combina o uso de big data e aprendizado de máquina para automatizar processos da operação de TI, como:

  • Correlação de Eventos
  • Detecção de Anomalias
  • Identificação de Causa Raiz.

Ou seja, atividades em que antes era necessária intervenção humana, agora podem ser feitas de forma automatizada, com um alto grau de confiabilidade. Os principais benefícios para o negócio são:

  • Maior disponibilidade ao reduzir o tempo de identificação dos problemas e o MTTR (Tempo médio de reparo)
  • Redução de custos operacionais
  • Maior qualidade dos serviços provido aos clientes
  • Maior agilidade e eficiência de TI

Como o Zero-touch pode ser aplicado à Monitoração?

De forma simples, podemos dividir o espectro da monitoração de TI em 4 estágios: Aquisição de Dados, Agregação, Análise e Ação.

Aquisição de Dados

Aquisição de Dados é um processo automatizado uma vez que ele tenha sido configurado para determinada aplicação, infraestrutura, etc. Mas, em muitos casos, o provisionamento para novos sistemas ainda é manual, ou seja, se eu coloco uma nova aplicação em produção ou subo novas VMs, tenho que manualmente instruir o sistema de monitoração para começar a coletar dados daqueles sistemas.

A utilização de tecnologias como Infrastructure-as-a-Service e Infrastructure-as-Code são cruciais em termos de automação no âmbito de monitoração. Através delas, desde o provisionamento de hardware, instalação/configuração de sistemas operacionais e respectivas dependências, e instalação de soluções na infraestrutura recém-provisionada podem ocorrer de maneira ágil, padronizada e automática.

Considerando a volatilidade e flexibilidade de ambientes que proporcionam experiência de nuvem, onde recursos são provisionados e descomissionados constantemente, utilizar dos recursos de automação para instrumentar a monitoração é essencial para garantir operação consistente e escalável.

Alternativamente, também é importante o controle e o mapeamento da infraestrutura através de sistemas de discovery e CMDB. Esses sistemas também podem ajudar a identificar partes da infraestrutura que estejam descobertos de monitoramento.

Agregação de Dados

Para a Agregação de Dados, as soluções de AIOps são flexíveis, aceitando fontes de dados diversas como bases de dados, APIs e arquivos de logs. Os formatos textuais, tabulares e em linguagens de marcação (como XML, JSON, YAML) são os mais comuns. Fica a cargo dessas soluções inferir estruturas e relações de forma automática, permitindo a configuração dos meios de agregação, objetivando a preparação para a análise desses dados, se necessário.

Análise dos Dados

Análise dos Dados, nos ambientes tradicionais, ainda é realizada ou configurada de forma manual, com os especialistas analisando a massa de dados para extrair insights, identificar causa raiz e tendências ou definindo thresholds e criando regras de correlação manualmente.

Plataformas de AIOps possuem capacidade tanto para analisar esses dados manualmente, quanto para integrar com mecanismos e frameworks de Machine Learning para criação de detecção e correlação inteligente - principalmente para os casos de uso mais comuns do ambiente de TI, como de duplicação de alarmes, inferência de regras a partir de dados de monitoração, predição de problemas baseado no histórico do comportamento da infraestrutura, entre outros.

Ação

Por fim, o estágio da Ação é executado pelos analistas de TI para resolverem os problemas, uma vez identificada a causa raiz ou um workaround. Essas atividades também estão sendo automatizadas, seja a resolução para parte dos problemas (self-healing), como também sugerindo passos para resolução de problemas mais complexos a partir de dados contextualizados, timeline dos eventos e análise de causa provável, o que diminui consideravelmente o MTTR de incidentes que não foram cobertos pela automação.

Um exemplo é o Red Hat Insights, que sugere correções baseadas na base de conhecimento e se integra ao Ansible Tower para execução dos passos sugeridos (gerando dinamicamente playbooks para resolver problemas no sistema operacional, resolver falhas de segurança ou configurações).

Leia também:
O papel da automação de TI na transformação de negócios

Você possui algum desses desafios? Entre em contato com o time de Icaro Tech e entenda como podemos ajudá-lo.

A Icaro Tech atua no mercado transformando os negócios através de automação há mais de 20 anos. Somos parceiros IBM e Red Hat e contamos com profissionais acreditados e capacitados para impulsionar a automação dentro das organizações.

Atuamos desde a concepção do projeto – com assessments e análise do negócio – até a implementação, evolução (melhoria contínua) e gerenciamento dele através de uma equipe altamente qualificada de serviços gerenciados.

 

Antonio Ideguchi e Gilson Missawa
Antonio é Arquiteto de Soluções e Gilson é Head de Marketing e Ofertas

linkedin facebook pinterest youtube rss twitter instagram facebook-blank rss-blank linkedin-blank pinterest youtube twitter instagram