By zerum
Criado:
25 nov, 2019
5 anos atrás
Data da última atualização: 24/01/2020
TAGS:
Quando algo sai errado na operação de TI, não é o jogo de empurra-empurra que vai resolver. Por que isso ainda acontece tanto?
A aplicação fica lenta. Começa a apresentar problemas. Começa também uma briga muito comum: de quem é a culpa? Infraestrutura? Desenvolvimento? Isso é mais comum do que se imagina. Veja as 3 principais razões que estão por trás desse tipo de situação:
Quando um problema acontece, qual deve ser o foco dos técnicos e dos gestores: a) trabalhar juntos e buscar soluções; b) achar os culpados e fazer com que eles “paguem” pelo erro?
Lógico que o mais importante é resolver o problema, mas na grande maioria das empresas, a insegurança dos técnicos e gestores é tão grande em “assumir” uma falha, que faz-se de tudo para apontar o dedo para outra área. Isso cria situações extremamente disfuncionais, onde muitas mentiras são criadas para proteger as pessoas, enquanto todos trabalham de maneira isolada para resolver o problema (levando muito mais tempo que o necessário).
Geralmente o problema é resolvido e ninguém sabe realmente o que foi feito, porque o “culpado” nunca vai aparecer, causando desgaste para a equipe como um todo.
Por isso é importante ter uma melhor integração entre os times e NUNCA procurar indivíduos culpados por algo. Também é de fundamental importância que o time de uma determinada aplicação inclua as áreas de desenvolvimento, banco de dados e infraestrutura.
Acontece quando não há compartilhamento das informações entre as equipes. É natural que o escopo da monitoração varie entre os times. Por exemplo: a equipe de desenvolvimento tem interesse na monitoração de métricas relevantes à execução da aplicação (código, queries, webservices), enquanto a equipe de infraestrutura geralmente monitora a capacidade e disponibilidade dos recursos (ex. uptime, CPU, RAM, disco, rede).
Porém, para realmente entender a causa-raiz de um problema é preciso enxergar o ambiente como um todo e não de forma segmentada. Para isso existem ferramentas que integram monitoração em todas as esferas, garantindo visibilidade certa para todos.
Quando uma aplicação vai entrar em produção é preciso verificar se os testes foram executados (inclusive os testes de carga), e avaliar se a infraestrutura disponível para aplicação foi corretamente provisionada.
Quando não se observa com muito critério e proatividade se a aplicação está instalada na infraestrutura correta, com recursos suficientes de rede, disco, CPU, etc, prejuízos vão acontecer e correções terão que ser feitas DEPOIS que o usuário perceber o problema, com grandes prejuízos à imagem da empresa.
Por isso executar testes de carga é uma etapa essencial, inclusive antes de colocar em produção novas versões do mesmo sistema. Uma única query em banco mal-feita pode colocar tudo a perder.
A Zerum é uma empresa de Data Science líder em inovação que fornece visibilidade e entendimento em tempo real sobre fluxos de dados complexos. Nossos produtos, serviços e tecnologias ajudam grandes organizações a reduzir gargalos operacionais, combater ameaças cibernéticas avançadas, detectar fraudes e manter comunidades seguras.
Para saber mais, entre em contato.