O que é o monitoramento de um sistema?
Monitoramento refere-se ao processo de coletar dados de uma aplicação de forma em que possibilite a compreensão da saúde (performance, disponibilidade, comportamento, etc) da mesma. Seu objetivo principal é garantir que o software está funcionando e performando da maneira em que se espera e identificar possíveis problemas e anomalias, visando a correção de maneira mais rápida e gerando o menor impacto possível.
APM - Application Performance Monitoring
É um processo que é implementado nas aplicações para coletar dados de telemetria, tais como quantidade de requisições, porcentagem de erro, etc.
Como realizar o monitoramento de uma aplicação?
Para garantir a coleta dos dados que possibilitam o monitoramento é necessário a execução de 4 etapas:
- Planejamento: nessa etapa são definidas quais as métricas que deseja-se coletar da aplicação, tais como o throughput, tempo de respost, etc.
- Instrumentação: nessa etapa é onde a implementação dos mecanismos que irão realizar a coleta dos dados que geram as métricas definidas na etap anterior.
- Observação: nessa etapa nós já temos as métricas para a compreensão da saúde da nossa aplicação.
- Detecção e resolução de um problema: uma vez que na etapa de observação se constatou um problema, nessa etapa realizamos a investigação e correção do mesmo.
Qual a importância de um bom monitoramento?
Com a alta competitividade do mercado nos dias de hoje, as empresas são obrigadas a inovar diariamente e, com isso, gera-se uma demanda elevada de novas funcionalidades e melhorias nos sistemas. Para garantir a qualidade dessas faz-se necessário um bom monitoramento.
As principais perguntas que um bom monitoramento responde
- O serviço está online e disponível?
- As funcionalidades do serviço estão desempenhando corretamente?
- O serviço está performando da maneira que se espera?
Como analisar a qualidade do monitoramento?
Existem duas métricas que nos auxiliam a analisar a qualidade do monitoramento:
- MTTD - Mean Time To Detection: tempo médio para detecção de um problema.
- MTTR - Mean Time To Resolution: tempo médio para resolução de um problema.
Quer ver mais contribuições, perguntas e respostas da comunidade?