IT Ops

Análise de dados sumarizados e não-sumarizados: qual é a diferença?

Análise de dados sumarizados e não-sumarizados: qual é a diferença?

By zerum

Criado:
26 nov, 2019
5 anos atrás
Data da última atualização: 14/09/2022

TAGS:

< Voltar para o blog

Ferramentas de análise de tráfego utilizam métodos diferentes para lidar com o imenso volume de informações, sumarizando ou não os dados. Veja a diferença.

Uma das características fundamentais do Zerum Valk é a extração e o armazenamento das informações de transações, de protocolos diversos (ex. HTTP, DNS, Oracle, etc), de forma semi-estruturada (JSON) e granular – ou seja, sem sumarizar os dados.

Mas o que quer dizer sumarizar os dados? E no que isso implica?

Dados sumarizados

Se considerarmos uma rede de 10 Gigabits por segundo, muito comum hoje em dia, o volume de transações por segundo chega às dezenas de milhares. São queries em bancos de dados, requisições por arquivos, envios de formulários, chamadas de DNS e assim por diante.

E não podemos confundir isso com a métrica de pacotes por segundo: uma transação é sempre formada por dezenas e até milhões de pacotes. Assim, devido ao volume imenso de dados, diversas ferramentas que analisam tráfego de rede usam a estratégia de sumarizar, ou resumir, as informações antes de guarda-las e exibi-las em suas interfaces.

Ao sumarizar um dado, se faz uma média das métricas encontradas, a partir de uma informação a ser exibida. Por exemplo, ao invés de se exibir quantos pacotes, retransmissões e bytes foram trafegados em cada requisição, faz-se uma média de todos esses valor para um grupo de requisições similares, por um período de tempo específico (ex.: sumarizar por minuto).

O problema dessa abordagem é óbvio: perde-se a informação, os detalhes reais. E muitas vezes é no detalhe que se encontra a causa do problema.

Dados não-sumarizados

No Zerum Valk as informações de transações são guardadas de forma granular, sem sumarização, e o usuário pode fazer agregações customizadas ou visualizar cada transação de forma independente (inclusive o conteúdo do payload, se desejado). Assim, quando é necessário fazer análises profundas, ou mesmo treinar modelos de machine learning, essa informação detalhada ajuda – e muito!

Sobre a Zerum

A Zerum é uma empresa de Data Science líder em inovação que fornece visibilidade e entendimento em tempo real sobre fluxos de dados complexos. Nossos produtos, serviços e tecnologias ajudam grandes organizações a reduzir gargalos operacionais, combater ameaças cibernéticas avançadas, detectar fraudes e manter comunidades seguras.

Para saber mais, entre em contato!

Related articles

Observabilidade na camada de Aplicação: Uma necessidade no cenário atual
Observabilidade na camada de Aplicação: Uma necessidade no cenário atual

As equipes de TI estão cada vez mais focadas na melhoria da segurança,...

11 meses atrás

By Zerum Team

Superando desafios do BYOD com análise de performance e segurança cibernética
Superando desafios do BYOD com análise de performance e segurança cibernética

A adoção da política de “traga o seu próprio dispositivo”, do “Bring Your...

1 ano atrás

By Zerum Team

Observabilidade: Além do monitoramento
Observabilidade: Além do monitoramento

A área de tecnologia da informação é repleta de sistemas complexos, frequentemente distribuídos,...

1 ano atrás

By Zerum Team