IT Ops

Automatize a detecção de problemas de rede com machine learning

Automatize a detecção de problemas de rede com machine learning

By zerum

Criado:
25 nov, 2019
5 anos atrás
Data da última atualização: 24/01/2020

TAGS:

< Voltar para o blog

O aprendizado de máquina é um aliado poderoso para detectar problemas ou anomalias em grandes ambientes conectados.

Machine learning (aprendizado de máquina) é uma das áreas que mais avançou tecnologicamente nos últimos anos. O tópico da inteligência artificial vem transformando várias áreas da ciência e da nossa sociedade, gerando grande interesse.

De cinco anos para cá, o Google registrou um aumento de mais de 1.428% em buscas utilizando o termo machine learning. Uma pesquisa no Google Scholar pelo mesmo termo já retorna mais de 4 milhões de artigos até o fechamento deste post.

Esse interesse não vem à toa. A tecnologia tem inúmeras aplicações, como assistentes de voz em smartphones, filtros de spam, detecção de fraudes, predições para mercados de valores, detecção de doenças e outros diagnósticos médicos e, como veremos neste artigo, detecção de anomalias em grandes redes de computadores.

Desafios no monitoramento de rede

Ser capaz de detectar variações potencialmente problemáticas e agir com base nesse conhecimento é essencial para garantir a saúde e segurança da rede. Anomalias nesses ambientes podem sinalizar uma série de problemas, entre eles:

  • Falhas de configuração em ativos de rede;
  • Sobrecarga de equipamentos e aplicações;
  • Balanceamento de carga entre nós;
  • Ataques de força bruta.

Porém, analisar a quantidade absurda de transações de um ambiente computacional e identificar anomalias em meio a elas é uma tarefa extremamente desafiadora e, na maioria das vezes, demorada.

Desafiadora, porque mudanças sutis ao longo do tempo, por exemplo, podem passar despercebidas em uma análise humana, sendo notadas apenas quando já é tarde demais. Ou ainda, um comportamento anômalo na rede hoje pode ser normal no fim do mês.

Demorada, porque para se ter um panorama do que está acontecendo ou prestes a acontecer, é preciso fazer um comparativo com eventos de períodos anteriores. Como saber se a leitura atual de uma métrica é compatível com o esperado no mesmo período do dia ou semana anterior?

É aqui que entra o aprendizado de máquina. Algoritmos de machine learning podem ser empregados para transformar a imensa quantidade de dados de rede (wire data) em conhecimento, ajudando a identificar e evitar problemas no ambiente.

Detecção de anomalias de rede com machine learning

A inteligência artificial nos permite automatizar a identificação de eventos que fogem do padrão, mesmo nas mais extensas e complexas estruturas de rede. Para isto, é preciso indicar uma métrica chave para ser analisada pelo algoritmo.

O algoritmo é treinado para compreender o comportamento da métrica selecionada, gerando o conhecimento necessário para apontar o que é ou não anômalo. Esse treinamento pode se basear em um intervalo específico de tempo, ou em um processo de aprendizado constante que acompanha a evolução da sua rede.

Gráfico representando detecção de anomalias de rede com machine learning

Em ambos os casos, o conhecimento adquirido gera uma baseline dinâmica que prevê como a métrica deve se comportar ao longo do tempo. Assim, toda vez que houver um comportamento inesperado, podemos ser alertados em tempo real (imagem acima) e agir em tempo hábil para solucionar/evitar problemas na operação.

É importante salientar que a eficácia do algoritmo depende da qualidade e quantidade dos dados utilizados no treinamento. Até o momento, wire data têm sido a fonte mais rica de informações para este fim, oferecendo uma entrada completa e contínua de informações. Esta combinação de recursos (coleta e análise de wire data, machine learning e sistema de alarmes inteligentes) é encontrada nas soluções mais avançadas de Wire Data Analytics, como o Zerum Valk.

Conclusão

Utilizando modernos algoritmos de machine learning, conseguimos prever o comportamento de métricas importantes de rede. O aprendizado acumulado gera o que chamamos de baseline dinâmica. Com o monitoramento contínuo dessas métricas, podemos gerar alarmes sempre que surgirem leituras fora do esperado e evitar maiores problemas, automatizando de forma simples o oneroso processo de monitoramento.

Sobre a Zerum

A Zerum é uma empresa de Data Science líder em inovação que fornece visibilidade e entendimento em tempo real sobre fluxos de dados complexos. Nossos produtos, serviços e tecnologias ajudam grandes organizações a reduzir gargalos operacionais, combater ameaças cibernéticas avançadas, detectar fraudes e manter comunidades seguras.

Para saber mais, entre em contato.

Related articles

Observabilidade na camada de Aplicação: Uma necessidade no cenário atual
Observabilidade na camada de Aplicação: Uma necessidade no cenário atual

As equipes de TI estão cada vez mais focadas na melhoria da segurança,...

1 ano atrás

By Zerum Team

Superando desafios do BYOD com análise de performance e segurança cibernética
Superando desafios do BYOD com análise de performance e segurança cibernética

A adoção da política de “traga o seu próprio dispositivo”, do “Bring Your...

1 ano atrás

By Zerum Team

Observabilidade: Além do monitoramento
Observabilidade: Além do monitoramento

A área de tecnologia da informação é repleta de sistemas complexos, frequentemente distribuídos,...

2 anos atrás

By Zerum Team