Menu Docs

Noções básicas de alerta

O Atlas oferece ferramentas integradas, alertas, gráficos, integrações e registros para ajudá-lo a monitorar os clusters. O Atlas fornece alertas para ajudá-lo a monitorar seus clusters e melhorar o desempenho das seguintes maneiras:

  1. Uma variedade de condições pode trigger um alerta.

  2. Você pode definir as configurações de alerta com base em condições específicas para seu reconhecimento de data center, usuários, contas e muito mais.

  3. Ao resolver o alerta, você pode corrigir o problema imediato, implementar uma solução de longo prazo e monitorar seu progresso.

O Atlas emite alertas para o banco de dados e as condições do servidor definidas em suas configurações de alerta. Quando uma condição aciona um alerta, o Atlas exibe um símbolo de aviso no cluster e envia notificações de alerta. Suas configurações de alerta determinam os métodos de notificação. O Atlas continua enviando notificações em intervalos regulares até que a condição seja resolvida ou você exclua, ou desative o alerta.

Ao configurar alertas, você especifica condições e limites de alerta. Revise as possíveis alert conditions para as quais você pode Trigger alerts relacionados aos clusters.

Observação

M0 Clusters gratuitos e M2/M5 clusters compartilhados acionam apenas trigger alertas relacionados às métricas suportadas por esses clusters. Consulte Limites do Atlas M0 (cluster gratuito), M2 e M5 para obter a documentação completa sobre M0/M2/M5 as limitações métricas e de alerta.

Monitore consistentemente as métricas para ajudar a garantir clusters eficientes.

Essas condições de alerta ajudam a monitorar o número de operações de leitura ou gravação simultâneas que podem ocorrer. Quando todos os tíquetes são solicitados, as operações devem aguardar e entrar na fila.

Você pode visualizar essas métricas no gráfico Tickets Available , acessado por meio do monitoramento de cluster.

Para saber mais, consulte as condições de alerta de tickets disponíveis.

Essas condições de alerta medem as operações que aguardam em bloqueio.

Você pode visualizar essas métricas no gráfico Queues , acessado por meio do monitoramento de cluster.

Para saber mais, consulte as condições de alerta de filas.

Clusters do Amazon Web Services EC que permitem2 Burstable Performance pode ocorrer o roubo de CPU ao usar núcleos de CPU compartilhados. Essa condição de alerta mede a porcentagem pela qual o uso da CPU excede a taxa de acumulação de créditos de CPU da linha de base garantida.

Os créditos da CPU são unidades de utilização da CPU que você acumula. Os créditos se acumulam a uma taxa constante para fornecer um nível garantido de desempenho. Estes créditos podem ser utilizados para desempenho adicional da CPU. Quando o saldo de crédito se esgota, somente a linha de base garantida do desempenho da CPU é fornecida, e o valor do excesso é mostrado como porcentagem de roubo.

Você pode visualizar o uso da CPU no gráfico Normalized System CPU , acessado por meio do monitoramento de cluster.

Para saber mais, consulte a condição de alerta System: CPU (Steal) % is .

Índices configurados corretamente podem melhorar significativamente o desempenho da query. Essas condições de alert ajudam a identificar query ineficientes. Muitos índices podem impacto o desempenho de gravação.

Você pode visualizar essas métricas no gráfico Query Targeting , acessado por meio do monitoramento de cluster.

Para saber mais, consulte as condições de alerta de Direcionamento de Query.

Cada instância do Atlas tem um limite de conexão. Essas condições de alerta ajudam você a resolver proativamente as necessidades de dimensionamento ou possíveis problemas relacionados à disponibilidade da conexão.

Você pode visualizar essas métricas no gráfico Connections , acessado por meio do monitoramento de cluster.

Para saber mais, consulte as condições de alerta de conexão.

Para definir quais condições acionam alertas e como os usuários são notificados, configure as configurações de alerta. Você pode configurar alertas no nível da organização ou do projeto. O Atlas fornece alertas padrão no nível do projeto. Você pode clonar alertas existentes e configurar alertas da janela de manutenção.

Experimente valores de condição de alerta com base em seus requisitos específicos. Reavalie periodicamente esses valores para obter o desempenho ideal.

Defina as configurações de alerta para enviar um alerta se essas métricas cairem abaixo de 30 por pelo menos alguns minutos. Você deseja evitar falsos positivos desencadeados por quedas de curto prazo relativamente inofensivas, mas detectar problemas quando essas métricas permanecem baixas por um tempo.

Para configurar essas condições de alerta, consulte Definir configurações de alerta.

Defina as configurações de alerta para enviar um alerta se essas métricas passarem de 100 por um minuto. Você quer evitar falsos positivos desencadeados por picos relativamente inofensivos de curto prazo, mas detectar problemas quando essas métricas permanecerem elevadas por um tempo.

Para configurar essas condições de alerta, consulte Definir configurações de alerta.

Defina as configurações de alerta para enviar um alerta se essa métrica aumentar acima de 10%.

Para configurar essa condição de alerta, consulte Configurar configurações de alerta.

Defina as configurações de alerta para enviar um alerta se essa métrica ultrapassar 50 ou 100.

Para configurar essas condições de alerta, consulte Definir configurações de alerta.

Defina as configurações de alerta para enviar um alerta se a % de Conexão do limite configurado aumentar acima de 80% ou 90%.

Para configurar essas condições de alerta, consulte Definir configurações de alerta.

Quando uma condição aciona um alerta, o Atlas exibe um símbolo de aviso no cluster e envia notificações de alerta. Resolva esses alertas e trabalhe para evitar que as condições de alerta ocorram no futuro. Para saber como corrigir o problema imediato, implementar uma solução de longo prazo e monitorar seu progresso, consulte Resolver alertas.

O alerta de tickets disponíveis pode ajudá-lo a detectar query que demorou um pouco mais do que o esperado devido ao carregamento.

Aumentar o tamanho da instância ou, às vezes, a velocidade do disco, pode ajudar essas métricas.

Os alerta de filas podem ajudar você a detectar query que demoraram um pouco mais do que o esperado devido ao carregamento.

Aumentar o tamanho da instância ou, às vezes, a velocidade do disco, pode ajudar essas métricas.

O alerta System: CPU (Steal) % is ocorre quando o uso da CPU excede a taxa de acumulação de crédito de CPU da linha de base garantida pelo limite especificado.

Para saber mais, consulte Corrigir problemas de uso da CPU.

Os alertas de Direcionamento de Query geralmente indicam queries ineficientes.

Para saber mais, consulte Corrigir problemas de query.

Alertas de conexão tipicamente ocorrem quando o número máximo de conexões permitidas para um processo MongoDB foi excedido. Uma vez que o limite é excedido, nenhuma conexão nova pode ser aberta até que o número de conexões abertas caia abaixo do limite.

Para saber mais, consulte Corrigir problemas de conexão.

Quando uma condição de alerta é atendida, o ciclo de vida do alerta é iniciado.

Para saber mais, consulte o Fluxo de trabalho de alertas.