IT Ops

Análise de dados sumarizados e não-sumarizados: qual é a diferença?

Análise de dados sumarizados e não-sumarizados: qual é a diferença?

By zerum

Criado:
26 nov, 2019
4 anos atrás
Data da última atualização: 14/09/2022

TAGS:

< Voltar para o blog

Ferramentas de análise de tráfego utilizam métodos diferentes para lidar com o imenso volume de informações, sumarizando ou não os dados. Veja a diferença.

Uma das características fundamentais do Zerum Valk é a extração e o armazenamento das informações de transações, de protocolos diversos (ex. HTTP, DNS, Oracle, etc), de forma semi-estruturada (JSON) e granular – ou seja, sem sumarizar os dados.

Mas o que quer dizer sumarizar os dados? E no que isso implica?

Dados sumarizados

Se considerarmos uma rede de 10 Gigabits por segundo, muito comum hoje em dia, o volume de transações por segundo chega às dezenas de milhares. São queries em bancos de dados, requisições por arquivos, envios de formulários, chamadas de DNS e assim por diante.

E não podemos confundir isso com a métrica de pacotes por segundo: uma transação é sempre formada por dezenas e até milhões de pacotes. Assim, devido ao volume imenso de dados, diversas ferramentas que analisam tráfego de rede usam a estratégia de sumarizar, ou resumir, as informações antes de guarda-las e exibi-las em suas interfaces.

Ao sumarizar um dado, se faz uma média das métricas encontradas, a partir de uma informação a ser exibida. Por exemplo, ao invés de se exibir quantos pacotes, retransmissões e bytes foram trafegados em cada requisição, faz-se uma média de todos esses valor para um grupo de requisições similares, por um período de tempo específico (ex.: sumarizar por minuto).

O problema dessa abordagem é óbvio: perde-se a informação, os detalhes reais. E muitas vezes é no detalhe que se encontra a causa do problema.

Dados não-sumarizados

No Zerum Valk as informações de transações são guardadas de forma granular, sem sumarização, e o usuário pode fazer agregações customizadas ou visualizar cada transação de forma independente (inclusive o conteúdo do payload, se desejado). Assim, quando é necessário fazer análises profundas, ou mesmo treinar modelos de machine learning, essa informação detalhada ajuda – e muito!

Sobre a Zerum

A Zerum é uma empresa de Data Science líder em inovação que fornece visibilidade e entendimento em tempo real sobre fluxos de dados complexos. Nossos produtos, serviços e tecnologias ajudam grandes organizações a reduzir gargalos operacionais, combater ameaças cibernéticas avançadas, detectar fraudes e manter comunidades seguras.

Para saber mais, entre em contato!

Related articles

Observabilidade na camada de Aplicação: Uma necessidade no cenário atual
Observabilidade na camada de Aplicação: Uma necessidade no cenário atual

As equipes de TI estão cada vez mais focadas na melhoria da segurança,...

8 meses atrás

By Zerum Team

Superando desafios do BYOD com análise de performance e segurança cibernética
Superando desafios do BYOD com análise de performance e segurança cibernética

A adoção da política de “traga o seu próprio dispositivo”, do “Bring Your...

10 meses atrás

By Zerum Team

Observabilidade: Além do monitoramento
Observabilidade: Além do monitoramento

A área de tecnologia da informação é repleta de sistemas complexos, frequentemente distribuídos,...

1 ano atrás

By Zerum Team