Noções básicas de alerta
Nesta página
O Atlas oferece ferramentas integradas, alertas, gráficos, integrações e registros para ajudá-lo a monitorar os clusters. O Atlas fornece alertas para ajudá-lo a monitorar seus clusters e melhorar o desempenho das seguintes maneiras:
Uma variedade de condições pode trigger um alerta.
Você pode definir as configurações de alerta com base em condições específicas para seu reconhecimento de data center, usuários, contas e muito mais.
Ao resolver o alerta, você pode corrigir o problema imediato, implementar uma solução de longo prazo e monitorar seu progresso.
O Atlas emite alertas para o banco de dados e as condições do servidor definidas em suas configurações de alerta. Quando uma condição aciona um alerta, o Atlas exibe um símbolo de aviso no cluster e envia notificações de alerta. Suas configurações de alerta determinam os métodos de notificação. O Atlas continua enviando notificações em intervalos regulares até que a condição seja resolvida ou você exclua, ou desative o alerta.
Métricas úteis e condições de alerta
Ao configurar alertas, você especifica condições e limites de alerta. Revise as possíveis alert conditions para as quais você pode Trigger alerts relacionados aos clusters.
Observação
M0
Clusters gratuitos e M2/M5
clusters compartilhados acionam apenas trigger alertas relacionados às métricas suportadas por esses clusters. Consulte Limites do Atlas M0 (cluster gratuito), M2 e M5 para obter a documentação completa sobre M0/M2/M5
as limitações métricas e de alerta.
Monitore consistentemente as métricas para ajudar a garantir clusters eficientes.
Tickets disponíveis
Essas condições de alerta ajudam a monitorar o número de operações de leitura ou gravação simultâneas que podem ocorrer. Quando todos os tíquetes são solicitados, as operações devem aguardar e entrar na fila.
Você pode visualizar essas métricas no gráfico Tickets Available , acessado por meio do monitoramento de cluster.
Para saber mais, consulte as condições de alerta de tickets disponíveis.
Queues
Essas condições de alerta medem as operações que aguardam em bloqueio.
Você pode visualizar essas métricas no gráfico Queues , acessado por meio do monitoramento de cluster.
Para saber mais, consulte as condições de alerta de filas.
Roubo de CPU
Clusters do Amazon Web Services EC que permitem2 Burstable Performance pode ocorrer o roubo de CPU ao usar núcleos de CPU compartilhados. Essa condição de alerta mede a porcentagem pela qual o uso da CPU excede a taxa de acumulação de créditos de CPU da linha de base garantida.
Os créditos da CPU são unidades de utilização da CPU que você acumula. Os créditos se acumulam a uma taxa constante para fornecer um nível garantido de desempenho. Estes créditos podem ser utilizados para desempenho adicional da CPU. Quando o saldo de crédito se esgota, somente a linha de base garantida do desempenho da CPU é fornecida, e o valor do excesso é mostrado como porcentagem de roubo.
Você pode visualizar o uso da CPU no gráfico Normalized System CPU , acessado por meio do monitoramento de cluster.
Para saber mais, consulte a condição de alerta System: CPU (Steal) % is
.
Segmentação de query
Índices configurados corretamente podem melhorar significativamente o desempenho da query. Essas condições de alert ajudam a identificar query ineficientes. Muitos índices podem impacto o desempenho de gravação.
Você pode visualizar essas métricas no gráfico Query Targeting , acessado por meio do monitoramento de cluster.
Para saber mais, consulte as condições de alerta de Direcionamento de Query.
Limites de conexão
Cada instância do Atlas tem um limite de conexão. Essas condições de alerta ajudam você a resolver proativamente as necessidades de dimensionamento ou possíveis problemas relacionados à disponibilidade da conexão.
Você pode visualizar essas métricas no gráfico Connections , acessado por meio do monitoramento de cluster.
Para saber mais, consulte as condições de alerta de conexão.
Configurar alertas
Para definir quais condições acionam alertas e como os usuários são notificados, configure as configurações de alerta. Você pode configurar alertas no nível da organização ou do projeto. O Atlas fornece alertas padrão no nível do projeto. Você pode clonar alertas existentes e configurar alertas da janela de manutenção.
Experimente valores de condição de alerta com base em seus requisitos específicos. Reavalie periodicamente esses valores para obter o desempenho ideal.
Tickets disponíveis
Defina as configurações de alerta para enviar um alerta se essas métricas cairem abaixo de 30 por pelo menos alguns minutos. Você deseja evitar falsos positivos desencadeados por quedas de curto prazo relativamente inofensivas, mas detectar problemas quando essas métricas permanecem baixas por um tempo.
Para configurar essas condições de alerta, consulte Definir configurações de alerta.
Queues
Defina as configurações de alerta para enviar um alerta se essas métricas passarem de 100 por um minuto. Você quer evitar falsos positivos desencadeados por picos relativamente inofensivos de curto prazo, mas detectar problemas quando essas métricas permanecerem elevadas por um tempo.
Para configurar essas condições de alerta, consulte Definir configurações de alerta.
Roubo de CPU
Defina as configurações de alerta para enviar um alerta se essa métrica aumentar acima de 10%.
Para configurar essa condição de alerta, consulte Configurar configurações de alerta.
Segmentação de query
Defina as configurações de alerta para enviar um alerta se essa métrica ultrapassar 50 ou 100.
Para configurar essas condições de alerta, consulte Definir configurações de alerta.
Limites de conexão
Defina as configurações de alerta para enviar um alerta se a % de Conexão do limite configurado aumentar acima de 80% ou 90%.
Para configurar essas condições de alerta, consulte Definir configurações de alerta.
Resolver alertas
Quando uma condição aciona um alerta, o Atlas exibe um símbolo de aviso no cluster e envia notificações de alerta. Resolva esses alertas e trabalhe para evitar que as condições de alerta ocorram no futuro. Para saber como corrigir o problema imediato, implementar uma solução de longo prazo e monitorar seu progresso, consulte Resolver alertas.
Tickets disponíveis
O alerta de tickets disponíveis pode ajudá-lo a detectar query que demorou um pouco mais do que o esperado devido ao carregamento.
Aumentar o tamanho da instância ou, às vezes, a velocidade do disco, pode ajudar essas métricas.
Queues
Os alerta de filas podem ajudar você a detectar query que demoraram um pouco mais do que o esperado devido ao carregamento.
Aumentar o tamanho da instância ou, às vezes, a velocidade do disco, pode ajudar essas métricas.
Roubo de CPU
O alerta System: CPU (Steal) % is
ocorre quando o uso da CPU excede a taxa de acumulação de crédito de CPU da linha de base garantida pelo limite especificado.
Para saber mais, consulte Corrigir problemas de uso da CPU.
Segmentação de query
Os alertas de Direcionamento de Query geralmente indicam queries ineficientes.
Para saber mais, consulte Corrigir problemas de query.
Limites de conexão
Alertas de conexão tipicamente ocorrem quando o número máximo de conexões permitidas para um processo MongoDB foi excedido. Uma vez que o limite é excedido, nenhuma conexão nova pode ser aberta até que o número de conexões abertas caia abaixo do limite.
Para saber mais, consulte Corrigir problemas de conexão.
Fluxo de trabalho de alertas
Quando uma condição de alerta é atendida, o ciclo de vida do alerta é iniciado.
Para saber mais, consulte o Fluxo de trabalho de alertas.