IT Ops

Análise de dados sumarizados e não-sumarizados: qual é a diferença?

By zerum

Criado:
26 nov, 2019
3 anos atrás
Data da última atualização: 14/09/2022

TAGS:

< Voltar para o blog

Ferramentas de análise de tráfego utilizam métodos diferentes para lidar com o imenso volume de informações, sumarizando ou não os dados. Veja a diferença.

Uma das características fundamentais do Zerum Valk é a extração e o armazenamento das informações de transações, de protocolos diversos (ex. HTTP, DNS, Oracle, etc), de forma semi-estruturada (JSON) e granular – ou seja, sem sumarizar os dados.

Mas o que quer dizer sumarizar os dados? E no que isso implica?

Dados sumarizados

Se considerarmos uma rede de 10 Gigabits por segundo, muito comum hoje em dia, o volume de transações por segundo chega às dezenas de milhares. São queries em bancos de dados, requisições por arquivos, envios de formulários, chamadas de DNS e assim por diante.

E não podemos confundir isso com a métrica de pacotes por segundo: uma transação é sempre formada por dezenas e até milhões de pacotes. Assim, devido ao volume imenso de dados, diversas ferramentas que analisam tráfego de rede usam a estratégia de sumarizar, ou resumir, as informações antes de guarda-las e exibi-las em suas interfaces.

Ao sumarizar um dado, se faz uma média das métricas encontradas, a partir de uma informação a ser exibida. Por exemplo, ao invés de se exibir quantos pacotes, retransmissões e bytes foram trafegados em cada requisição, faz-se uma média de todos esses valor para um grupo de requisições similares, por um período de tempo específico (ex.: sumarizar por minuto).

O problema dessa abordagem é óbvio: perde-se a informação, os detalhes reais. E muitas vezes é no detalhe que se encontra a causa do problema.

Dados não-sumarizados

No Zerum Valk as informações de transações são guardadas de forma granular, sem sumarização, e o usuário pode fazer agregações customizadas ou visualizar cada transação de forma independente (inclusive o conteúdo do payload, se desejado). Assim, quando é necessário fazer análises profundas, ou mesmo treinar modelos de machine learning, essa informação detalhada ajuda – e muito!

Sobre a Zerum

A Zerum é uma empresa de Data Science líder em inovação que fornece visibilidade e entendimento em tempo real sobre fluxos de dados complexos. Nossos produtos, serviços e tecnologias ajudam grandes organizações a reduzir gargalos operacionais, combater ameaças cibernéticas avançadas, detectar fraudes e manter comunidades seguras.

Para saber mais, entre em contato!

Related articles

Operations Intelligence: O que é, quando e porque usar?
Operations Intelligence: O que é, quando e porque usar?

Com um foco nas operações do dia a dia, o conceito de Operations...

2 meses atrás

By Zerum Team

Analisando queries de transações DNS para otimizar e proteger a operação de TI
Analisando queries de transações DNS para otimizar e proteger a operação de TI

Veja como explorar requisições de nomes de domínio feitas através servidores DNS, e...

3 anos atrás

By zerum

Monitorando a efetividade de controles de Firewall com Wire Data Analytics
Monitorando a efetividade de controles de Firewall com Wire Data Analytics

Veja como Wire Data Analytics ajuda a garantir a efetividade dos controles de...

3 anos atrás

By zerum