Menu Docs
Página inicial do Docs
/
MongoDB Ops Manager
/ /

Revise as condições de alerta

Nesta página

  • Alertas do host
  • Alertas de conjunto de réplicas
  • Alertas de cluster fragmentados
  • Alertas de agentes
  • alerta de backup
  • Alertas de connector BI
  • Alertas de usuário
  • Alertas de projeto

Para cadaprojeto ou alerta global criado, você deve definir uma meta e uma condição ou métrica. O destino aponta para o que mudou: o componente MongoDB Ops Manager . Se sua condição se tornar verdadeira ou uma métrica atender ao limite definido, o MongoDB Ops Manager acionará um alerta. Para saber mais, consulte Fluxo de trabalho de alertas.

Para definir uma condição:

  1. Selecione um Target na lista.

  2. Selecione uma condição na lista condition/metric .

O Ops Manager Atlas Triggers um alerta quando a condição é true na instância do MongoDB de destino especificada.

Para definir uma métrica:

  1. Selecione um tipo de Target na lista.

  2. Filtre o tipo Target ou selecione Any.

  3. Selecione uma métrica na lista condition/metric .

  4. Selecione se esta métrica deve ser Below ou Above o limite.

  5. Digite um valor limite. Todos os limites são números.

  6. Selecione a unidade de medida para o limite.

O Ops Manager aciona um alerta quando o limite da métrica é atingido na instância do MongoDB de destino especificada.

Ao definir um alerta para um host, selecione o host type que se aplica a este alerta e o condition que aciona este alerta.

Para host type, defina um alerta para todos ou um dos seguintes tipos de processos do MongoDB:

Definir Tipo de Host para:
O alerta inclui
Qualquer tipo
Todos os tipos descritos nesta tabela.
Autônomo
Qualquer instância mongod que não faça parte de um conjunto de réplicas ou cluster fragmentado nem seja usado como servidor de configuração.
Principal
Todos os conjuntos de réplicas primários.
secundário
Árbitro
mongos
Todas as instâncias de mongos .
Confissão
Todas as instâncias mongod usadas como servidores de configuração.

Você pode definir um alerta para quando a instância do MongoDB for alterada. As condições de status do host incluem:

Condição
Gatilho de alerta
Anfitrião adicionado
MongoDB Ops Manager começa a monitorar ou gerenciar um mongod ou mongos pela primeira vez.
Anfitrião removido
MongoDB Ops Manager para de monitorar ou gerenciar um mongod ou mongos pela primeira vez.
Host adicionado ao conjunto de réplicas
O tipo especificado de processo mongod é adicionado a um conjunto de réplicas.
Host removido do conjunto de réplicas
O tipo especificado de processo mongod é removido de um conjunto de réplicas.
O host reiniciou
O Ops Manager detecta que um host foi reiniciado.
As reinicializações na última hora são
O Ops Manager detecta que o número de vezes que um host reiniciado dentro da hora anterior excede o limite especificado.
O host sofreu uma reversão

O MongoDB Ops Manager detecta que um mongod em um host acionou uma reversão.

Os seguintes tipos de host não podem sofrer reversões:

Para saber mais, consulte Rollbacks durante o failover do conjunto de réplicas.

O host está se recuperando
Um secundário entra no estado RECOVERING . Para saber mais sobre o estado do RECOVERING , consulte Estados do membro do conjunto de réplicas.
O host não tem a versão mais recente

A revisão do MongoDB em execução em um host está duas ou mais revisões atrás da versão estável atual do MongoDB.

Por exemplo, se a versão estável atual for MongoDB 4.0.9, um host que esteja executando o MongoDB 4.0.8 não trigger um alerta, mas um host que estiver executando o MongoDB 4.0.7 trigger um alerta.

Para saber mais sobre a numeração de versões do MongoDB , consulte MongoDB de versão do MongoDB no manual do MongoDB.

O certificado SSL do host expira dentro de 30 dias
O certificado SSL para uma instância do MongoDB é de 30 dias a partir da expiração. O gerente de operações reenvia o alerta a cada 24 horas até ser resolvido ou confirmado. Se você não resolver ou reconhecer o alerta e o certificado expirar, o Ops Manager continuará enviando o alerta. Se o certificado expirar, o Monitoramento não poderá mais se conectar à instância do MongoDB.
O host está inativo

O Ops Manager não recebe um ping de um host por mais de 4 minutos. Em operação normal, o Monitoramento se conecta a cada host monitorado cerca de uma vez por minuto. O Ops Manager aguarda 4 minutos antes de acionar o alerta para minimizar os falsos positivos, como ocorreria durante a reinicialização de um host.

Se o host continuar inacessível, o monitoramento eventualmente reduzirá a frequência de ping para cada 5 minutos para um mongod e para cada 20 minutos para um mongos. Se um mongod ou mongos ficar acessível novamente, o MongoDB Ops Manager reconhecerá o processo em 5 minutos.

Se a automação MongoDB Ops Manager não gerenciar um processo mongos e esse processo permanecer inacessível por 30 dias, o MongoDB Ops Manager removerá o processo da guia Deployment. No entanto, se você reiniciar o processo mongos , o MongoDB Ops Manager o detectará.

Para resolver esse alerta, consulte Corrigir o host.

Você pode definir o alerta Host Has Index Suggestions para receber um alerta se o Performance Advisor tiver sugestões de índice para o host.

Se a taxa de direcionamento de query de um host exceder consistentemente 10.000 por um período de 10 minutos, o Performance Advisor verificará se há queries ineficientes no host e possíveis índices para melhorar o desempenho. Se o Performance Advisor determinar que o host se beneficiaria de um ou mais índices, esse alerta será acionado e o orientará a criar os índices sugeridos.

Este alerta não trigger para projeto em que o Performance Advisor está desabilitado.

Você pode definir alertas para quantos erros de asserção por segundo a instância criou.

Observação

Como é medido

O MongoDB informa sobre opscounters usando o documento asserts que o comando serverStatus retorna.

As métricas de afirmação incluem:

Métrica
Gatilho de alerta
Afirmações: Regular é
A taxa de afirmações regulares atende ao limite especificado.
Afirmações: o aviso é
A taxa de avisos atende ao limite especificado.
Afirmações: Msg é
A taxa de afirmações de mensagens atende ao limite especificado. Os alertas de mensagens são erros internos do servidor. Os rastreamentos de pilha são registrados para eles.
Afirmações: o usuário é
A taxa de afirmações que os usuários criam atende ao seu limite especificado.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Importante

Aplica-se apenas ao MongoDB 3.4 ou posterior

As métricas a seguir se aplicam apenas a sistemas que executam o MongoDB versão 3.4 ou posterior.

Você pode definir alertas para saber quanto tempo as operações levam para serem concluídas. As métricas de tempo de execução incluem:

Métrica
Gatilho de alerta
Tempo médio de execução: os comandos são
O tempo médio de execução das operações de comando atende ao seu limite especificado.
Tempo médio de execução: as leituras são
O tempo médio de execução para operações de leitura atende ao limite especificado.
Tempo médio de execução: as gravações são
O tempo médio de execução para operações de gravação atende ao seu limite especificado.

Você pode definir alertas para quantos documentos MongoDB são processados por segundo. As métricas de processamento de documentos incluem:

Métrica
Gatilho de alerta
Métricas do documento: Excluído é
A taxa média por segundo de documentos excluídos atende ao seu limite especificado.
Métricas do documento: inserido é
A taxa média por segundo de documentos inseridos atende ao seu limite especificado.
Métricas do documento: retornado é
A taxa média por segundo de documentos retornados atende ao seu limite especificado.
Métricas do documento: a atualização é
A taxa média por segundo de documentos atualizados atende ao seu limite especificado.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Você pode definir alerta para saber com que rapidez o MongoDB verifica itens durante query e quantos itens são verificados em comparação com o documento retornados. As métricas de tempo de execução da query incluem:

Observação

Como é medido

O MongoDB mede o desempenho da query com base no comando de explicação .

Query Targeting: Scanned is

A taxa média por segundo para verificar itens de índice durante query e avaliações do plano de query atende ao limite especificado.

Query Targeting: Scanned Objects is

A taxa média por segundo para digitalizar documentos atende ao limite especificado.

Query Targeting: Scanned / Returned is

A proporção de itens de índice digitalizados para documentos devolvidos atende ao limite especificado.

Query Targeting: Scanned Objects / Returned is

A proporção de documentos digitalizados para documentos devolvidos atende ao limite especificado.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Você pode definir alerta para quantas operações de reconhecimento de data center são concluídas por segundo.

Observação

Como é medido

O MongoDB informa sobre opscounters usando o documento opscounters que o comando serverStatus retorna.

As métricas de operação incluem:

Condição
Gatilho de alerta
Opcounter: Comando é
A taxa média de comandos executados por segundo atende ao seu limite especificado.
Opcounter: Excluir é
A taxa média de exclusões realizadas por segundo atende ao seu limite especificado.
Opcounter: Getmores é
A taxa média de getMores realizadas por segundo atende ao seu limite especificado. Em um primário, esse número pode ser alto mesmo que a contagem de query seja baixa. Os secundários "getMore" do primário como parte da replicação.
Opcounter: Insert é
A taxa média de inserções realizadas por segundo atende ao seu limite especificado.
Opcounter: a query é
A taxa média de queries realizadas por segundo atende ao seu limite especificado.
Opcounter: a atualização é
A taxa média de atualizações realizadas por segundo atende ao seu limite especificado.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Você pode definir alertas para quantas operações de banco de dados de dados por segundo são replicadas para um secundáriodo MongoDB .

Observação

Como é medido

O MongoDB informa sobre opscounters usando o documento opscountersRepl do qual o comando serverStatus retorna.

As métricas da operação de replicação incluem:

Métrica
Gatilho de alerta
Opcounter: Repl CMd é
A taxa média de comandos replicados aplicados por segundo atende ao seu limite.
Opcounter: Repl Delete é
A taxa média de exclusões replicadas aplicadas por segundo atende ao seu limite.
Opcounter: Repl Insert é
A taxa média de inserções replicadas aplicadas por segundo atende ao seu limite.
Opcounter: a atualização do Repl é
A taxa média de atualizações replicadas aplicadas por segundo atende ao seu limite.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Você pode definir alertas para a quantidade de memória que uma instância do MongoDB usa. Defina esse limite em bits, kilobits, megabits, gigabits, bytes, kilobytes, megabytes, gigabytes, terabytes ou petabytes.

Observação

Como é medido

O MongoDB informa sobre a memória usando o documento mem que o comando serverStatus retorna.

As métricas de memória incluem:

Métrica
Gatilho de alerta
Memória: o residente é
O tamanho da memória residente do processo mongod atende ao seu limite especificado. Com o tempo em um host de banco de dados de dados dedicado, a memória residente pode se aproximar da quantidade de RAM no host.
Memória: Virtual é
O tamanho da memória virtual do processo mongod atende ao seu limite especificado. Você pode usar este alerta para sinalizar memória excessiva fora do mapeamento de memória.
Memória: mapeada é
O tamanho da memória mapeada para o processo mongod atende ao seu limite especificado. Como o MongoDB mapeia todos os arquivos de dados, o tamanho da memória mapeada deve se aproximar do tamanho total do banco de dados de dados.
Memória: computada é
O tamanho da memória virtual do processo mongod que não é contabilizado pelo mapeamento de memória atende ao seu limite especificado. Se esse número for muito alto (vários gigabytes), isso indica que a memória excessiva está sendo usada fora do mapeamento de memória.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

As métricas de segurança incluem:

Métrica
Gatilho de alerta
O host tem recomendações de segurança
A autenticação ou TLS está desabilitada.

As métricas de troca incluem:

Métrica
Gatilho de alerta
Trocar uso: usado é
A quantidade total de espaço de troca em uso atingiu o limite especificado.
Trocar uso: o máximo usado é
A quantidade total máxima de espaço de troca em uso atinge o limite especificado.
Trocar uso: Grátis é
A quantidade de espaço de troca disponível ficou abaixo do limite especificado.
Trocar uso: o máximo gratuito é
A quantidade máxima de espaço de troca disponível cai abaixo do limite especificado.

Você pode definir alertas para a quantidade de cache do WiredTiger que uma instância do MongoDB usa. Defina esse limite em bits, kilobits, megabits, gigabits, bytes, kilobytes, megabytes, gigabytes, terabytes ou petabytes.

Observação

Como é medido

O MongoDB informa sobre a memória usando o documento cache que o comando serverStatus retorna.

As métricas de cache do WiredTiger incluem:

Métrica
Gatilho de alerta
Cache: os bytes lidos no cache são
A taxa média de bytes por segundo lidos no cache do WiredTiger atende ao seu limite especificado.
Cache: bytes gravados do cache são
A taxa média de bytes por segundo gravados a partir do cache do WiredTiger atende ao seu limite especificado.
Cache: bytes sujos são
Número de bytes sujos rastreados atualmente no cache do WiredTiger.
Cache: os bytes usados são
Número de bytes atualmente no cache do WiredTiger.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Importante

Aplica-se apenas ao MongoDB 2.2 a 2.6

Essas métricas só Atlas Triggers alerta em implantações que executam as versões 2.2 a 2.6 do MongoDB.

Você pode definir alertas para quantas operações btree na instância MongoDB são concluídas por segundo. As métricas do B-tree incluem:

Métrica
Gatilho de alerta
B-tree: os acessos são
O número de acessos aos índices B-tree atende ao seu limite especificado.
B-tree: os acertos são
O número de vezes que uma página B-tree estava na memória atende ao limite especificado.
B-tree: as faltas são
O número de vezes que uma página B-tree não estava na memória atende ao limite especificado.
B-tree: a taxa de erros é
A proporção de erros para acionamentos atende ao seu limite especificado.

Importante

Aplica-se apenas ao MongoDB 2.2 a 2.6

Essa métrica Atlas Triggers alerta apenas em implantações que executam as versões 2.2 a 2.6 do MongoDB.

Você pode definir alertas para a porcentagem de tempo em que a instância do MongoDB está bloqueada para gravação. As métricas de porcentagem de trava eficaz incluem:

Métrica
Gatilho de alerta
% de trava efetiva é
Se a porcentagem do tempo total em que a instância está bloqueada para gravação atender ao limite especificado.

Importante

Aplica-se apenas ao reconhecimento de data center que executam o MMAPv1

Essa métrica só Atlas Triggers alerta em implantações que executam mecanismos de armazenamento MMAPv1 para seus reconhecimento de data center MongoDB.

Você pode definir um alerta para saber quanto tempo, em milissegundos, a liberação média na instância do MongoDB leva para ser concluída. Uma liberação é a gravação de dados a partir da memória no disco.

Observação

Como é medido

O MongoDB relata o tempo médio de liberação do background usando o valor de backgroundFlushing.average_ms que o comando serverStatus retorna.

As métricas médias de liberação de background incluem:

Métrica
Gatilho de alerta
A média de fluxo de background é
O tempo médio para descargas de background atende ao seu limite especificado.

Você pode definir alertas para as conexões ativas com a instância do MongoDB.

Observação

Como é medido

O MongoDB informa sobre a memória usando o documento connections que o comando serverStatus retorna.

As métricas de conexão incluem:

Métrica
Gatilho de alerta
Conexões é
O número de conexões de host ativas atende ao limite especificado.
A % de conexões do limite configurado é

A porcentagem de conexões de host ativas para o número total de conexões possíveis atende ao limite especificado. O valor padrão para as versões 2.6.0 e 3.0.0 do MongoDB é 65536 e o valor padrão para versões do MongoDB superiores a (>) 3.0.0, é 1000000. Você pode substituir o valor padrão de duas maneiras:

  • Use o mongod --maxConnns para definir o número máximo de conexões simultâneas para mongod. Para saber mais, consulte Opções principais do mongod.

  • Atualize o campo net.maxIncomingConnections no arquivo de configuração MongoDB . Para saber mais, consulte Opções de rede.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Você pode definir alertas para as operações que aguardam travas.

Observação

Como é medido

O MongoDB informa sobre a memória usando o documento globalLock.currentQueue que o comando serverStatus retorna.

As métricas de fila incluem:

Métrica
Gatilho de alerta
Filas: o total é
O número de operações em espera em uma bloqueio de qualquer tipo atenda ao limite especificado.
Filas: os leitores são
O número de operações de leitor em espera em uma bloqueio de qualquer tipo atenda ao limite especificado.
Filas: os escritores são
O número de operações de gravador que aguardam uma bloqueio de qualquer tipo atenda ao limite especificado.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Importante

Aplica-se apenas ao MongoDB 2.2 a 2.6

As métricas Accesses Not In Memory: Total is e Page Fault Exceptions Thrown: Total is trigger alerta apenas em sistemas que executam as versões 2.2 a 2.6 do MongoDB.

Você pode definir alertas para falhas de página.

Observação

Como é medido

O MongoDB informa sobre a memória usando o documento extra_info.page_faults que o comando serverStatus retorna.

O MongoDB 2.2 a 2.6 relatou as métricas Accesses Not In Memory: Total is e Page Fault Exceptions Thrown: Total is usando o documento recordStats que o comando serverStatus retornou.

As métricas de falha de página incluem:

Métrica
Gatilho de alerta
Acessos que não estão na memória: o total é
A taxa de acessos ao disco atende ao limite especificado. O MongoDB deve acessar os dados no disco se o seu conjunto de trabalho não couber na memória. Essa métrica é encontrada no gráfico Record Stats do host.
Exceções de falha de página lançadas: o total é
A taxa de exceções de falhas de página lançadas atende ao limite especificado. Esta métrica é encontrada no gráfico Record Stats do host.
As falhas da página são
A taxa de falhas de página (independentemente de uma exceção ser lançada ou não) atende ao limite especificado. Esta métrica é encontrada no gráfico Page Faults do host.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Você pode definir alertas para o número de cursores abertos e expirados para um processo MongoDB .

Observação

Como é medido

O MongoDB informa sobre a memória usando o documento metrics.cursor que o comando serverStatus retorna.

As métricas do cursor incluem:

Métrica
Gatilho de alerta
Cursores: o tamanho dos cursores do cliente é
A quantidade de memória que o host usa para manter os cursores atende ao seu limite especificado.
Cursores: Abrir é
O número de cursores que o host está mantendo para clientes atende ao limite especificado.
cursor: o tempo limite é
O número de cursores de tempo limite que o host está mantendo para clientes atende ao limite especificado.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Você pode definir alertas para a taxa de transferência da rede para um processo do MongoDB.

Observação

Como é medido

O MongoDB informa sobre a memória usando o documento network que o comando serverStatus retorna.

As métricas de rede incluem:

Métrica
Gatilho de alerta
Rede: Bytes em é
O número de bytes enviados para o host do reconhecimento de data center atende ao seu limite especificado.
Rede: Bytes de saída é
O número de bytes enviados do host do banco de dados atende ao seu limite especificado.
Rede: o número de solicitações é

O número de solicitações enviadas para o host do reconhecimento de data center atende ao limite especificado.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Você pode definir alertas para os oplogs de replicação de um processo do MongoDB.

Observação

Como é medido

O MongoDB informa sobre o oplog de replicação usando o documento oplog que o comando serverStatus retorna combinado com os resultados de rs.status() e rs.conf().

As métricas de oplog de replicação incluem:

Métrica
Gatilho de alerta
O Espaço de Replicação é
A diferença entre a oplog window de replicação da origem de sincronização e o atraso de replicação de replicação do secundário atende ao limite especificado. Um secundário pode Go em RECOVERING se esse valor for para 0.
Tempo de réplica é
A quantidade aproximada de tempo em milissegundos disponível no oplog de replicação do primary atende ao seu limite especificado.
Os dados de oplog por hora são
A taxa média de gigabytes de oplog que o primary gera por hora atende ao limite especificado.
atraso de replicação é
Número aproximado de segundos em que o secundário está atrás do primário no aplicação de gravação . Somente é preciso se o atraso for maior que 1a2 segundos, pois a precisão dessa estatística é limitada.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Você pode definir alertas para as operações de varredura e pedido de um processo MongoDB.

Observação

Como é medido

O MongoDB informa sobre o Oplog de replicação usando o documento metrics.operation.scanAndOrder que o comando serverStatus retorna.

As métricas de operações incluem:

Métrica
Gatilho de alerta
Operações: digitalização e pedido são
Taxa média por segundo acima do limite especificado de query que retornam resultados ordenados que não podem executar a operação de classificação utilizando um índice.

Você pode definir alertas para a quantidade de armazenamento de dados usada. As métricas de armazenamento do reconhecimento de data center incluem:

Métrica
Gatilho de alerta
O armazenamento DB é
A quantidade de espaço de armazenamento no disco usada pelas extensões atende ao limite especificado.
O tamanho dos dados do banco de dados é
O tamanho real dos dados no banco de dados atende ao limite especificado.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Você pode definir alertas para a quantidade de armazenamento de registros no diário usado. As métricas de registros no diário incluem:

Métrica
Gatilho de alerta
O registro de commits no diário do bloqueio de escrita é
A taxa de confirmações que ocorreram enquanto o banco de dados estava em bloqueio de escrita atende ao limite especificado.
Registro no diário MB é
A quantidade média de dados em megabytes que o Ops Manager grava no registro de recuperação por segundo atende ao limite especificado.
O registro no diário arquivos de leitura de dados MB é
A taxa média de dados em megabytes que o Ops Manager grava nos reconhecimento de data center por segundo atende ao limite especificado. Como essas gravações já estão registradas no diário, elas podem ocorrer preguiçosamente e, portanto, o número indicado aqui pode ser menor do que a quantidade físicamente gravada no disco.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Você pode definir alertas para tickets do WiredTiger.

Observação

Como é medido

O MongoDB informa o WiredTiger usando os documentos wiredTiger.cache e wiredTiger.concurrentTransactions que o comando serverStatus retorna.

As condições do storage engine WiredTiger incluem:

Métrica
Gatilho de alerta
Incentivos disponíveis: lê-se
O número de tickets de leitura disponíveis para o storage engine WiredTiger atende ao seu limite especificado.
Bilhetes disponíveis: Escreve é
O número de tickets de gravação disponíveis para o storage engine WiredTiger atende ao seu limite especificado.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Você pode definir alertas para utilização de computação e disco. As condições dos recursos do sistema incluem:

Métrica
Gatilho de alerta
Sistema: CPU (roubo) % é

Aplicável quando o saldo de crédito da instância EC2 estiver esgotado.

A porcentagem de tempo em que a CPU está em um estado de "espera involuntária". A porcentagem de roubo da CPU é a porcentagem pela qual o uso da CPU excede a taxa de acumulação de créditos de CPU da linha de base garantida.

Esse alerta normalmente é acionado quando todos os créditos foram consumidos em uma Amazon Web Services instância de desempenho estável .

Sistema: A % máxima de CPU (roubo) é
A porcentagem máxima de tempo em que a CPU está em um estado de "espera involuntária" excede o limite especificado.
Sistema: CPU (usuário) % é
Uso da CPU do processo MongoDB, dimensionado para uma faixa de 0-100%, dividindo-se pelo número de CPUs.
Sistema: a % máxima de CPU (usuário) é
O uso máximo da CPU do processo MongoDB, dimensionado para uma faixa de 0-100%, dividindo-se pelo número de CPUs que excede o limite especificado.
Memória do sistema: usada é
A memória total do sistema usada para mongod menos buffers, cache e memória livre atende ao limite especificado.
Memória do sistema: o máximo usado é
O valor máximo de uso de memória do sistema atende ao limite especificado.
Memória do sistema: Disponível é
O uso de memória do sistema disponível para o mongod ficou abaixo do limite especificado.
Memória do sistema: o máximo disponível é
A quantidade máxima de memória do sistema disponível cai abaixo do limite especificado.
A % de espaço em disco usado no modelo de dados é
Porcentagem de espaço em disco usado em qualquer partição que contém os dados da coleção MongoDB.
A % máxima de espaço em disco usado no modelo de dados é
A porcentagem máxima de espaço em disco usada em qualquer partição que contém os dados da collection MongoDB excede o limite especificado.
A % de espaço em disco usado na partição do índice é
Porcentagem de espaço em disco usado em qualquer partição que contém os dados de índice MongoDB.
A % máxima de espaço em disco usado na partição de índice é
A porcentagem máxima de espaço em disco usada em qualquer partição que contém os dados de índice MongoDB excede o limite especificado.
A % de espaço em disco usado na partição do diário é
Porcentagem de espaço em disco usado na partição que contém o diário MongoDB, se o registro no diário estiver habilitado.
A % máxima de espaço em disco usado na partição do Diário é
A porcentagem máxima de espaço em disco usada na partição que contém o diário MongoDB excede o limite especificado.
A rede do sistema de entrada é
O número de bytes por segundo enviados para o host do reconhecimento de data center atende ao limite especificado.
A entrada máxima da rede do sistema é
O número máximo de bytes enviados para o MongoDB atende ao limite especificado.
A saída de rede do sistema é
O número de bytes por segundo enviados do host do reconhecimento de data center atende ao seu limite especificado.
A saída máxima da rede do sistema é
O número máximo de bytes enviados do MongoDB atende ao limite especificado.

Observação

Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.

  1. Na visualização Deployment do projeto do Ops Manager, clique na guia List .

  2. Clique no processo que você deseja monitorar.

  3. Clique na aba Status.

  4. Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.

Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .

Você pode definir alertas sobre o status do primário e o número de membros saudáveis em um conjunto de réplicas. As condições do conjunto de réplicas incluem:

Condição
Gatilho de alerta
Conjunto de réplicas eleito um novo primary

Um conjunto elege um novo primário. Cada vez que o MongoDB Ops Manager recebe um ping, ele inspeciona a saída do método rs.status() do conjunto de réplicas para o status de cada membro do conjunto de réplicas. A partir dessa saída, o MongoDB Ops Manager determina qual membro do conjunto de réplicas é o principal. Se o primário encontrado nos dados de ping for diferente do primário atual conhecido pelo MongoDB Ops Manager, esse alerta será acionado.

Receber esse alerta nem sempre média que o conjunto elegeu uma nova primária. Esse alerta também pode trigger quando a mesma primária for reeleita. Isso pode acontecer quando o Ops Manager processa um ping no meio de uma eleição.

O conjunto de réplicas não tem primário

Um conjunto de réplicas não tem um primary. Especificamente, quando nenhum dos membros de um conjunto de réplicas tem o status PRIMARY, o alerta Atlas Triggers. Por exemplo, essa condição pode surgir quando um conjunto tem um número par de membros votantes, resultando em um empate.

Se o monitoramento coleta dados durante uma eleição para primário, esse alerta pode enviar um falso positivo. Para evitar esses falsos positivos, defina o intervalo de configuração de alerta after waiting (na seção Send to da configuração).

Para obter soluções, consulte Corrigir primário perdido.

As métricas do conjunto de réplicas incluem:

Métrica
Gatilho de alerta
O número de membros saudáveis é
Um conjunto de réplicas tem menos membros íntegros do que o limite especificado.
O número de membros não íntegros é
Um conjunto de réplicas tem mais membros não íntegros do que o limite especificado.
O número de eleições na última hora é > X
O número de eleições que ocorreram na última hora excedeu o valor de X especificado pelo usuário. O valor de X é definido quando você cria o alerta. Esse alerta pode indicar que a replicação do cluster não está em um estado saudável, conforme evidenciado por eleições constantes.

Observação

Um membro do conjunto de réplicas é considerado íntegro se você executar rs.status() para esse conjunto de réplicas e o resultado retornar PRIMARY ou SECONDARY para esse membro. Os secundários e árbitros ocultos não são contados.

Você pode definir um alerta para um mongos ausente em um cluster fragmentado. As condições de cluster fragmentado incluem:

Condição
Gatilho de alerta
O cluster não tem um mongos ativo
MongoDB Ops Manager não pode alcançar nenhum mongos para o cluster.

Você pode definir alertas para o status ou o controle de versão do agente. As condições do agente incluem:

Condição
Gatilho de alerta
A automação está inativa

Nenhuma automação é detectada por pelo menos 1 minuto. Em operação normal, a automação envia um ping ao Ops Manager aproximadamente uma vez a cada 10 segundos. Se o Ops Manager não receber um ping por pelo menos 1 minuto, este Atlas Triggers será acionado.

Este alerta Atlas Triggers somente se a automação estiver gerenciando um processo MongoDB ou módulo de agente.

O monitoramento está inativo

Nenhum monitoramento é detectado por pelo menos 7 minutos. Em operação normal, o monitoramento envia um ping ao gerente de operações aproximadamente uma vez por minuto. Se o gerente de operações não receber um ping por pelo menos 7 minutos, esse alerta será acionado. No entanto, esse alerta nunca é acionado para um projeto que não tenha hosts configurados.

IMPORTANTE: quando o monitoramento está inativo, o MongoDB Ops Manager não aciona outros alertas para nenhum host. Por exemplo: se um host estiver inativo, não haverá monitoramento para enviar dados ao MongoDB Ops Manager que possam trigger novos alertas.

O monitoramento não tem a versão mais recente
O monitoramento não está executando a versão mais recente do software.
O backup está inativo

O backup de um projeto com pelo menos um conjunto de réplicas ativas ou cluster está inativo há mais de 1 hora.

Para resolver este alerta:

  1. Para ver qual host exibe o Backup, clique em Deployment e, em seguida, na guia Servers .

  2. Verifique o arquivo de log do Backup neste host.

O backup não tem a versão mais recente
O backup não está executando a versão mais recente do software.
O backup tem muitas falhas de chamada em conferência

A topologia do cluster conhecida pelo monitoramento não corresponde à configuração de backup das chamadas em conferência que o backup faz.

O número de tentativas atende ao limite especificado na configuração maximumFailedConfCalls .

Você pode usar este alerta apenas como um alerta global .

Você pode definir alertas para oplog de backup, ressincronização e inconsistências. As condições de backup incluem:

Condição
Gatilho de alerta
O oplog de backup está atrasado

Os dados de oplog mais recentes recebidos pelo MongoDB Ops Manager têm mais de 75 minutos.

Para resolver esse alerta, consulte Corrigir problemas de oplog no backup.

O backup exige uma ressincronização

O processo de replicação de um backup fica muito atrás do oplog para se atualizar. Isso ocorre quando o host substitui as entradas de oplog que o backup ainda não replicou. Quando isso acontecer, você deverá ressincronizar o backup, conforme descrito no procedimento Ressincronizar um backup.

Além disso, verifique o registro de backup correspondente. Se você ver um teste de "ponto comuns com falha", uma das seguintes situações pode ter acontecido.

  • Ocorreu um evento de rollback significativo no conjunto de réplicas de backup.

  • oplog do conjunto de réplicas de backup foi redimensionado ou excluído.

  • A alta rotatividade de oplog fez com que o agente perdesse a cauda do oplog.

A configuração de backup inconsistente foi detectada

O Ops Manager detectou que a configuração de um backup não corresponde à configuração da implantação do MongoDB que ele faz backup.

Para resolver esse alerta, consulte Corrigir backup inconsistente.

A contagem inconsistente de snapshots do cluster é...

O Ops Manager falha um número consecutivo de vezes para tirar com êxito um snapshot do cluster. Este alerta é acionado quando o número de tentativas atinge o limite especificado.

O texto de alerta pode conter o motivo do problema. Problemas comuns incluem:

  • Não havia nenhum mongos acessível. Para resolver esse problema, certifique-se de que haja pelo menos um mongos sendo exibido na página Deployment do MongoDB Ops Manager .

  • balanceador não pôde ser interrompido. Para resolver esse problema, verifique os arquivos de log do primeiro servidor de configuração para determinar por que o balanceador não para.

  • Não foi possível inserir um token em um ou mais shards. Para resolver esse problema, garanta a conectividade entre o backup e todos os shards.

Não foi possível atribuir o backup a um daemon de backup

Uma tarefa de backup não se vincula a um Backup Daemon.

Por exemplo, os motivos pelos quais um tarefa pode não conseguir incluir, mas não estão limitados a:

  • Nenhum primary foi encontrado para o conjunto de réplicas de backup. No momento em que a vinculação ocorreu, o monitoramento não detectou um primary. Verifique se o conjunto de réplicas está íntegro.

  • Não há espaço suficiente disponível em nenhum Backup Daemon.

    Em ambos os casos, resolva o problema e reinicie a sincronização inicial do backup.

    Como alternativa, você pode vincular manualmente as tarefa aos daemon por meio da interface Admin . Consulte Trabalhos para obter mais informações.

Você pode usar este alerta apenas como um alerta global .

O backup atingiu um número alto de tentativas

Envia um alerta se a mesma tarefa falhar repetidamente. Isso pode acontecer, por exemplo, durante a manutenção. Verifique o registro de tarefas correspondente para ver se há uma mensagem de erro explicando o problema.

Entre em contato com o Suporte do MongoDB se precisar de ajuda para interpretar a mensagem de erro.

Você pode usar este alerta apenas como um alerta global .

O backup está em um estado inesperado

Algo inesperado aconteceu e o estado de backup para o conjunto de réplicas é broken. Você deve ressincronizar o conjunto de réplicas de backup, conforme descrito no procedimento Ressincronizar um Backup .

No caso de um alerta Backup is in an unexpected state , verifique o registro de tarefas correspondente para ver se há uma mensagem de erro explicando o problema. Entre em contato com o Suporte do MongoDB se precisar de ajuda para interpretar a mensagem de erro.

Você pode usar este alerta apenas como um alerta global .

O conjunto de réplicas tem um snapshot atrasado

Um snapshot falhou ao ser concluído antes do início do próximo snapshot. Verifique o registro da tarefa na interface de administração do Ops Manager em busca de erros.

Você pode usar este alerta apenas como um alerta global .

A transferência de sincronização da fatia não avançou em...

Uma sincronização inicial começou, mas posteriormente foi paralisada. Problemas que podem causar isso incluem, mas não estão limitados a:

  • processos que estão inativos (agentes, ingestão, bancos de dados de backup)

  • problemas de rede

  • credenciais de autenticação incorretas

Você pode usar este alerta apenas como um alerta global .

A tarefa de backup está ativa há...

Uma tarefa de backup funcionou por mais horas em um período de 24 horas do que o limite especificado.

Diferentes tarefas de backup compartilham Backup Daemons ou armazenamentos de snapshots. O tempo de execução da tarefa de backup pode variar. Tarefas de backup de longa duração podem fazer com que as tarefas restantes fiquem para trás ou falhem. Defina essa métrica para quanto tempo você espera que os backups levem para serem concluídos em seu sistema.

Você deve verificar o registro de tarefas correspondente para ver se há mensagens de erro. Entre em contato com o Suporte do MongoDB se precisar de ajuda para interpretar a mensagem de erro.

Você pode usar este alerta apenas como um alerta global .

Essas condições de alerta se aplicam ao uso do BI Connector com o Ops Manager.

Condição
Gatilho de alerta
BI Connector is down

A automação não detecta o processo do BI Connector por pelo menos 4 minutos.

IMPORTANTE: quando a automação está inativa, o MongoDB Ops Manager não pode trigger alertas para o BI Connector.

Você pode definir alertas para adição, remoção e alterações de função de usuários. As condições do usuário incluem:

Condição
Gatilho de alerta
O usuário entrou no projeto
Um novo usuário se junta ao projeto.
O usuário sai do projeto
Um usuário sai do projeto.
O usuário teve sua função alterada
As funções de um usuário foram alteradas.

Você pode definir alertas para a aprovação do usuário e a configuração da autenticação. As condições do projeto incluem:

Condição
Gatilho de alerta
Os usuários não têm a autenticação de dois fatores habilitada
O projeto tem usuários que não configuraram a autenticação de dois fatores.
alerta de verificação de segurança atualizados
Os alertas da verificação de segurança do projeto foram alterados.

Voltar

Configurar e resolver alertas