Revise as condições de alerta
Nesta página
Para cadaprojeto ou alerta global criado, você deve definir uma meta e uma condição ou métrica. O destino aponta para o que mudou: o componente MongoDB Ops Manager . Se sua condição se tornar verdadeira ou uma métrica atender ao limite definido, o MongoDB Ops Manager acionará um alerta. Para saber mais, consulte Fluxo de trabalho de alertas.
Para definir uma condição:
Selecione um Target na lista.
Selecione uma condição na lista condition/metric .
O Ops Manager Atlas Triggers um alerta quando a condição é true
na instância do MongoDB de destino especificada.
Para definir uma métrica:
Selecione um tipo de Target na lista.
Filtre o tipo Target ou selecione Any.
Selecione uma métrica na lista condition/metric .
Selecione se esta métrica deve ser Below ou Above o limite.
Digite um valor limite. Todos os limites são números.
Selecione a unidade de medida para o limite.
O Ops Manager aciona um alerta quando o limite da métrica é atingido na instância do MongoDB de destino especificada.
Alertas do host
Ao definir um alerta para um host, selecione o host type que se aplica a este alerta e o condition que aciona este alerta.
Tipos de host
Para host type, defina um alerta para todos ou um dos seguintes tipos de processos do MongoDB:
Definir Tipo de Host para: | O alerta inclui |
---|---|
Qualquer tipo | Todos os tipos descritos nesta tabela. |
Autônomo | Qualquer instância mongod que não faça parte de um conjunto de réplicas ou cluster fragmentado nem seja usado como servidor de configuração. |
Principal | Todos os conjuntos de réplicas primários. |
secundário | Todos os secundários do conjunto de réplicas. |
Árbitro | Todos os árbitros do conjunto de réplicas. |
mongos | Todas as instâncias de mongos . |
Confissão | Todas as instâncias mongod usadas como servidores de configuração. |
Condições de alerta do host
Alteração no status do host
Você pode definir um alerta para quando a instância do MongoDB for alterada. As condições de status do host incluem:
Condição | Gatilho de alerta |
---|---|
Anfitrião adicionado | |
Anfitrião removido | |
Host adicionado ao conjunto de réplicas | O tipo especificado de processo mongod é adicionado a um conjunto de réplicas. |
Host removido do conjunto de réplicas | O tipo especificado de processo mongod é removido de um conjunto de réplicas. |
O host reiniciou | O Ops Manager detecta que um host foi reiniciado. |
As reinicializações na última hora são | O Ops Manager detecta que o número de vezes que um host reiniciado dentro da hora anterior excede o limite especificado. |
O host sofreu uma reversão | O MongoDB Ops Manager detecta que um mongod em um host acionou uma reversão. Os seguintes tipos de host não podem sofrer reversões: Para saber mais, consulte Rollbacks durante o failover do conjunto de réplicas. |
O host está se recuperando | Um secundário entra no estado RECOVERING . Para saber mais sobre o estado do RECOVERING , consulte Estados do membro do conjunto de réplicas. |
O host não tem a versão mais recente | A revisão do MongoDB em execução em um host está duas ou mais revisões atrás da versão estável atual do MongoDB. Por exemplo, se a versão estável atual for MongoDB 4.0.9, um host que esteja executando o MongoDB 4.0.8 não trigger um alerta, mas um host que estiver executando o MongoDB 4.0.7 trigger um alerta. Para saber mais sobre a numeração de versões do MongoDB , consulte MongoDB de versão do MongoDB no manual do MongoDB. |
O certificado SSL do host expira dentro de 30 dias | O certificado SSL para uma instância do MongoDB é de 30 dias a partir da expiração. O gerente de operações reenvia o alerta a cada 24 horas até ser resolvido ou confirmado. Se você não resolver ou reconhecer o alerta e o certificado expirar, o Ops Manager continuará enviando o alerta. Se o certificado expirar, o Monitoramento não poderá mais se conectar à instância do MongoDB. |
O host está inativo | O Ops Manager não recebe um ping de um host por mais de 4 minutos. Em operação normal, o Monitoramento se conecta a cada host monitorado cerca de uma vez por minuto. O Ops Manager aguarda 4 minutos antes de acionar o alerta para minimizar os falsos positivos, como ocorreria durante a reinicialização de um host. Se o host continuar inacessível, o monitoramento eventualmente reduzirá a frequência de ping para cada 5 minutos para um mongod e para cada 20 minutos para um mongos. Se um mongod ou mongos ficar acessível novamente, o MongoDB Ops Manager reconhecerá o processo em 5 minutos. Se a automação MongoDB Ops Manager não gerenciar um processo mongos e esse processo permanecer inacessível por 30 dias, o MongoDB Ops Manager removerá o processo da guia Deployment. No entanto, se você reiniciar o processo mongos , o MongoDB Ops Manager o detectará. Para resolver esse alerta, consulte Corrigir o host. |
Consultor
Você pode definir o alerta Host Has Index Suggestions para receber um alerta se o Performance Advisor tiver sugestões de índice para o host.
Se a taxa de direcionamento de query de um host exceder consistentemente 10.000 por um período de 10 minutos, o Performance Advisor verificará se há queries ineficientes no host e possíveis índices para melhorar o desempenho. Se o Performance Advisor determinar que o host se beneficiaria de um ou mais índices, esse alerta será acionado e o orientará a criar os índices sugeridos.
Este alerta não trigger para projeto em que o Performance Advisor está desabilitado.
Afirmações
Você pode definir alertas para quantos erros de asserção por segundo a instância criou.
Observação
Como é medido
O MongoDB informa sobre opscounters usando o documento asserts
que o comando serverStatus retorna.
As métricas de afirmação incluem:
Métrica | Gatilho de alerta |
---|---|
Afirmações: Regular é | A taxa de afirmações regulares atende ao limite especificado. |
Afirmações: o aviso é | A taxa de avisos atende ao limite especificado. |
Afirmações: Msg é | A taxa de afirmações de mensagens atende ao limite especificado. Os alertas de mensagens são erros internos do servidor. Os rastreamentos de pilha são registrados para eles. |
Afirmações: o usuário é | A taxa de afirmações que os usuários criam atende ao seu limite especificado. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Tempo médio de execução
Importante
Aplica-se apenas ao MongoDB 3.4 ou posterior
As métricas a seguir se aplicam apenas a sistemas que executam o MongoDB versão 3.4 ou posterior.
Você pode definir alertas para saber quanto tempo as operações levam para serem concluídas. As métricas de tempo de execução incluem:
Métrica | Gatilho de alerta |
---|---|
Tempo médio de execução: os comandos são | O tempo médio de execução das operações de comando atende ao seu limite especificado. |
Tempo médio de execução: as leituras são | O tempo médio de execução para operações de leitura atende ao limite especificado. |
Tempo médio de execução: as gravações são | O tempo médio de execução para operações de gravação atende ao seu limite especificado. |
Métricas do documento
Você pode definir alertas para quantos documentos MongoDB são processados por segundo. As métricas de processamento de documentos incluem:
Métrica | Gatilho de alerta |
---|---|
Métricas do documento: Excluído é | A taxa média por segundo de documentos excluídos atende ao seu limite especificado. |
Métricas do documento: inserido é | A taxa média por segundo de documentos inseridos atende ao seu limite especificado. |
Métricas do documento: retornado é | A taxa média por segundo de documentos retornados atende ao seu limite especificado. |
Métricas do documento: a atualização é | A taxa média por segundo de documentos atualizados atende ao seu limite especificado. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Segmentação de query
Você pode definir alerta para saber com que rapidez o MongoDB verifica itens durante query e quantos itens são verificados em comparação com o documento retornados. As métricas de tempo de execução da query incluem:
Query Targeting: Scanned is
A taxa média por segundo para verificar itens de índice durante query e avaliações do plano de query atende ao limite especificado.
Query Targeting: Scanned Objects is
A taxa média por segundo para digitalizar documentos atende ao limite especificado.
Query Targeting: Scanned / Returned is
A proporção de itens de índice digitalizados para documentos devolvidos atende ao limite especificado.
Query Targeting: Scanned Objects / Returned is
A proporção de documentos digitalizados para documentos devolvidos atende ao limite especificado.
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Opcounter
Você pode definir alerta para quantas operações de reconhecimento de data center são concluídas por segundo.
Observação
Como é medido
O MongoDB informa sobre opscounters usando o documento opscounters
que o comando serverStatus retorna.
As métricas de operação incluem:
Condição | Gatilho de alerta |
---|---|
Opcounter: Comando é | A taxa média de comandos executados por segundo atende ao seu limite especificado. |
Opcounter: Excluir é | A taxa média de exclusões realizadas por segundo atende ao seu limite especificado. |
Opcounter: Getmores é | A taxa média de getMores realizadas por segundo atende ao seu limite especificado. Em um primário, esse número pode ser alto mesmo que a contagem de query seja baixa. Os secundários "getMore" do primário como parte da replicação. |
Opcounter: Insert é | A taxa média de inserções realizadas por segundo atende ao seu limite especificado. |
Opcounter: a query é | A taxa média de queries realizadas por segundo atende ao seu limite especificado. |
Opcounter: a atualização é | A taxa média de atualizações realizadas por segundo atende ao seu limite especificado. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Opcounter - Repl
Você pode definir alertas para quantas operações de banco de dados de dados por segundo são replicadas para um secundáriodo MongoDB .
Observação
Como é medido
O MongoDB informa sobre opscounters usando o documento opscountersRepl
do qual o comando serverStatus retorna.
As métricas da operação de replicação incluem:
Métrica | Gatilho de alerta |
---|---|
Opcounter: Repl CMd é | A taxa média de comandos replicados aplicados por segundo atende ao seu limite. |
Opcounter: Repl Delete é | A taxa média de exclusões replicadas aplicadas por segundo atende ao seu limite. |
Opcounter: Repl Insert é | A taxa média de inserções replicadas aplicadas por segundo atende ao seu limite. |
Opcounter: a atualização do Repl é | A taxa média de atualizações replicadas aplicadas por segundo atende ao seu limite. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Memória
Você pode definir alertas para a quantidade de memória que uma instância do MongoDB usa. Defina esse limite em bits, kilobits, megabits, gigabits, bytes, kilobytes, megabytes, gigabytes, terabytes ou petabytes.
Observação
Como é medido
O MongoDB informa sobre a memória usando o documento mem
que o comando serverStatus retorna.
As métricas de memória incluem:
Métrica | Gatilho de alerta |
---|---|
Memória: o residente é | O tamanho da memória residente do processo mongod atende ao seu limite especificado. Com o tempo em um host de banco de dados de dados dedicado, a memória residente pode se aproximar da quantidade de RAM no host. |
Memória: Virtual é | O tamanho da memória virtual do processo mongod atende ao seu limite especificado. Você pode usar este alerta para sinalizar memória excessiva fora do mapeamento de memória. |
Memória: mapeada é | O tamanho da memória mapeada para o processo mongod atende ao seu limite especificado. Como o MongoDB mapeia todos os arquivos de dados, o tamanho da memória mapeada deve se aproximar do tamanho total do banco de dados de dados. |
Memória: computada é | O tamanho da memória virtual do processo mongod que não é contabilizado pelo mapeamento de memória atende ao seu limite especificado. Se esse número for muito alto (vários gigabytes), isso indica que a memória excessiva está sendo usada fora do mapeamento de memória. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Segurança
As métricas de segurança incluem:
Métrica | Gatilho de alerta |
---|---|
O host tem recomendações de segurança | A autenticação ou TLS está desabilitada. |
Swap
As métricas de troca incluem:
Métrica | Gatilho de alerta |
---|---|
Trocar uso: usado é | A quantidade total de espaço de troca em uso atingiu o limite especificado. |
Trocar uso: o máximo usado é | A quantidade total máxima de espaço de troca em uso atinge o limite especificado. |
Trocar uso: Grátis é | A quantidade de espaço de troca disponível ficou abaixo do limite especificado. |
Trocar uso: o máximo gratuito é | A quantidade máxima de espaço de troca disponível cai abaixo do limite especificado. |
Cache do WiredTiger
Você pode definir alertas para a quantidade de cache do WiredTiger que uma instância do MongoDB usa. Defina esse limite em bits, kilobits, megabits, gigabits, bytes, kilobytes, megabytes, gigabytes, terabytes ou petabytes.
Observação
Como é medido
O MongoDB informa sobre a memória usando o documento cache
que o comando serverStatus retorna.
As métricas de cache do WiredTiger incluem:
Métrica | Gatilho de alerta |
---|---|
Cache: os bytes lidos no cache são | A taxa média de bytes por segundo lidos no cache do WiredTiger atende ao seu limite especificado. |
Cache: bytes gravados do cache são | A taxa média de bytes por segundo gravados a partir do cache do WiredTiger atende ao seu limite especificado. |
Cache: bytes sujos são | Número de bytes sujos rastreados atualmente no cache do WiredTiger. |
Cache: os bytes usados são | Número de bytes atualmente no cache do WiredTiger. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
B-tree
Importante
Aplica-se apenas ao MongoDB 2.2 a 2.6
Essas métricas só Atlas Triggers alerta em implantações que executam as versões 2.2 a 2.6 do MongoDB.
Você pode definir alertas para quantas operações btree na instância MongoDB são concluídas por segundo. As métricas do B-tree incluem:
Métrica | Gatilho de alerta |
---|---|
B-tree: os acessos são | O número de acessos aos índices B-tree atende ao seu limite especificado. |
B-tree: os acertos são | O número de vezes que uma página B-tree estava na memória atende ao limite especificado. |
B-tree: as faltas são | O número de vezes que uma página B-tree não estava na memória atende ao limite especificado. |
B-tree: a taxa de erros é | A proporção de erros para acionamentos atende ao seu limite especificado. |
% de bloqueio efetiva
Importante
Aplica-se apenas ao MongoDB 2.2 a 2.6
Essa métrica Atlas Triggers alerta apenas em implantações que executam as versões 2.2 a 2.6 do MongoDB.
Você pode definir alertas para a porcentagem de tempo em que a instância do MongoDB está bloqueada para gravação. As métricas de porcentagem de trava eficaz incluem:
Métrica | Gatilho de alerta |
---|---|
% de trava efetiva é | Se a porcentagem do tempo total em que a instância está bloqueada para gravação atender ao limite especificado. |
Média de fluxo de background
Importante
Aplica-se apenas ao reconhecimento de data center que executam o MMAPv1
Essa métrica só Atlas Triggers alerta em implantações que executam mecanismos de armazenamento MMAPv1 para seus reconhecimento de data center MongoDB.
Você pode definir um alerta para saber quanto tempo, em milissegundos, a liberação média na instância do MongoDB leva para ser concluída. Uma liberação é a gravação de dados a partir da memória no disco.
Observação
Como é medido
O MongoDB relata o tempo médio de liberação do background usando o valor de backgroundFlushing.average_ms
que o comando serverStatus retorna.
As métricas médias de liberação de background incluem:
Métrica | Gatilho de alerta |
---|---|
A média de fluxo de background é | O tempo médio para descargas de background atende ao seu limite especificado. |
Conexões
Você pode definir alertas para as conexões ativas com a instância do MongoDB.
Observação
Como é medido
O MongoDB informa sobre a memória usando o documento connections
que o comando serverStatus retorna.
As métricas de conexão incluem:
Métrica | Gatilho de alerta |
---|---|
Conexões é | O número de conexões de host ativas atende ao limite especificado. |
A % de conexões do limite configurado é | A porcentagem de conexões de host ativas para o número total de conexões possíveis atende ao limite especificado. O valor padrão para as versões 2.6.0 e 3.0.0 do MongoDB é
|
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Queues
Você pode definir alertas para as operações que aguardam travas.
Observação
Como é medido
O MongoDB informa sobre a memória usando o documento globalLock.currentQueue
que o comando serverStatus retorna.
As métricas de fila incluem:
Métrica | Gatilho de alerta |
---|---|
Filas: o total é | O número de operações em espera em uma bloqueio de qualquer tipo atenda ao limite especificado. |
Filas: os leitores são | O número de operações de leitor em espera em uma bloqueio de qualquer tipo atenda ao limite especificado. |
Filas: os escritores são | O número de operações de gravador que aguardam uma bloqueio de qualquer tipo atenda ao limite especificado. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Falhas na página
Importante
Aplica-se apenas ao MongoDB 2.2 a 2.6
As métricas Accesses Not In Memory: Total is e Page Fault Exceptions Thrown: Total is trigger alerta apenas em sistemas que executam as versões 2.2 a 2.6 do MongoDB.
Você pode definir alertas para falhas de página.
Observação
Como é medido
O MongoDB informa sobre a memória usando o documento extra_info.page_faults
que o comando serverStatus retorna.
O MongoDB 2.2 a 2.6 relatou as métricas Accesses Not In Memory: Total is e Page Fault Exceptions Thrown: Total is usando o documento recordStats
que o comando serverStatus retornou.
As métricas de falha de página incluem:
Métrica | Gatilho de alerta |
---|---|
Acessos que não estão na memória: o total é | A taxa de acessos ao disco atende ao limite especificado. O MongoDB deve acessar os dados no disco se o seu conjunto de trabalho não couber na memória. Essa métrica é encontrada no gráfico Record Stats do host. |
Exceções de falha de página lançadas: o total é | A taxa de exceções de falhas de página lançadas atende ao limite especificado. Esta métrica é encontrada no gráfico Record Stats do host. |
As falhas da página são | A taxa de falhas de página (independentemente de uma exceção ser lançada ou não) atende ao limite especificado. Esta métrica é encontrada no gráfico Page Faults do host. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Cursors
Você pode definir alertas para o número de cursores abertos e expirados para um processo MongoDB .
Observação
Como é medido
O MongoDB informa sobre a memória usando o documento metrics.cursor
que o comando serverStatus retorna.
As métricas do cursor incluem:
Métrica | Gatilho de alerta |
---|---|
Cursores: o tamanho dos cursores do cliente é | A quantidade de memória que o host usa para manter os cursores atende ao seu limite especificado. |
Cursores: Abrir é | O número de cursores que o host está mantendo para clientes atende ao limite especificado. |
cursor: o tempo limite é | O número de cursores de tempo limite que o host está mantendo para clientes atende ao limite especificado. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Rede
Você pode definir alertas para a taxa de transferência da rede para um processo do MongoDB.
Observação
Como é medido
O MongoDB informa sobre a memória usando o documento network
que o comando serverStatus retorna.
As métricas de rede incluem:
Métrica | Gatilho de alerta |
---|---|
Rede: Bytes em é | O número de bytes enviados para o host do reconhecimento de data center atende ao seu limite especificado. |
Rede: Bytes de saída é | O número de bytes enviados do host do banco de dados atende ao seu limite especificado. |
Rede: o número de solicitações é | O número de solicitações enviadas para o host do reconhecimento de data center atende ao limite especificado. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Oplog de replicação
Você pode definir alertas para os oplogs de replicação de um processo do MongoDB.
Observação
Como é medido
O MongoDB informa sobre o oplog de replicação usando o documento oplog
que o comando serverStatus retorna combinado com os resultados de rs.status() e rs.conf().
As métricas de oplog de replicação incluem:
Métrica | Gatilho de alerta |
---|---|
O Espaço de Replicação é | A diferença entre a oplog window de replicação da origem de sincronização e o atraso de replicação de replicação do secundário atende ao limite especificado. Um secundário pode Go em RECOVERING se esse valor for para 0 . |
Tempo de réplica é | A quantidade aproximada de tempo em milissegundos disponível no oplog de replicação do primary atende ao seu limite especificado. |
Os dados de oplog por hora são | A taxa média de gigabytes de oplog que o primary gera por hora atende ao limite especificado. |
atraso de replicação é | Número aproximado de segundos em que o secundário está atrás do primário no aplicação de gravação . Somente é preciso se o atraso for maior que 1a2 segundos, pois a precisão dessa estatística é limitada. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Digitalização e pedido de operações
Você pode definir alertas para as operações de varredura e pedido de um processo MongoDB.
Observação
Como é medido
O MongoDB informa sobre o Oplog de replicação usando o documento metrics.operation.scanAndOrder
que o comando serverStatus retorna.
As métricas de operações incluem:
Métrica | Gatilho de alerta |
---|---|
Operações: digitalização e pedido são | Taxa média por segundo acima do limite especificado de query que retornam resultados ordenados que não podem executar a operação de classificação utilizando um índice. |
Armazenamento BD
Você pode definir alertas para a quantidade de armazenamento de dados usada. As métricas de armazenamento do reconhecimento de data center incluem:
Métrica | Gatilho de alerta |
---|---|
O armazenamento DB é | A quantidade de espaço de armazenamento no disco usada pelas extensões atende ao limite especificado. |
O tamanho dos dados do banco de dados é | O tamanho real dos dados no banco de dados atende ao limite especificado. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Registro no diário
Você pode definir alertas para a quantidade de armazenamento de registros no diário usado. As métricas de registros no diário incluem:
Métrica | Gatilho de alerta |
---|---|
O registro de commits no diário do bloqueio de escrita é | A taxa de confirmações que ocorreram enquanto o banco de dados estava em bloqueio de escrita atende ao limite especificado. |
Registro no diário MB é | A quantidade média de dados em megabytes que o Ops Manager grava no registro de recuperação por segundo atende ao limite especificado. |
O registro no diário arquivos de leitura de dados MB é | A taxa média de dados em megabytes que o Ops Manager grava nos reconhecimento de data center por segundo atende ao limite especificado. Como essas gravações já estão registradas no diário, elas podem ocorrer preguiçosamente e, portanto, o número indicado aqui pode ser menor do que a quantidade físicamente gravada no disco. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Mecanismo de armazenamento WiredTiger
Você pode definir alertas para tickets do WiredTiger.
Observação
Como é medido
O MongoDB informa o WiredTiger usando os documentos wiredTiger.cache
e wiredTiger.concurrentTransactions
que o comando serverStatus retorna.
As condições do storage engine WiredTiger incluem:
Métrica | Gatilho de alerta |
---|---|
Incentivos disponíveis: lê-se | O número de tickets de leitura disponíveis para o storage engine WiredTiger atende ao seu limite especificado. |
Bilhetes disponíveis: Escreve é | O número de tickets de gravação disponíveis para o storage engine WiredTiger atende ao seu limite especificado. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Alertas de sistema e disco
Você pode definir alertas para utilização de computação e disco. As condições dos recursos do sistema incluem:
Métrica | Gatilho de alerta |
---|---|
Sistema: CPU (roubo) % é | Aplicável quando o saldo de crédito da instância EC2 estiver esgotado. A porcentagem de tempo em que a CPU está em um estado de "espera involuntária". A porcentagem de roubo da CPU é a porcentagem pela qual o uso da CPU excede a taxa de acumulação de créditos de CPU da linha de base garantida. Esse alerta normalmente é acionado quando todos os créditos foram consumidos em uma Amazon Web Services instância de desempenho estável . |
Sistema: A % máxima de CPU (roubo) é | A porcentagem máxima de tempo em que a CPU está em um estado de "espera involuntária" excede o limite especificado. |
Sistema: CPU (usuário) % é | Uso da CPU do processo MongoDB, dimensionado para uma faixa de 0-100%, dividindo-se pelo número de CPUs. |
Sistema: a % máxima de CPU (usuário) é | O uso máximo da CPU do processo MongoDB, dimensionado para uma faixa de 0-100%, dividindo-se pelo número de CPUs que excede o limite especificado. |
Memória do sistema: usada é | A memória total do sistema usada para mongod menos buffers, cache e memória livre atende ao limite especificado. |
Memória do sistema: o máximo usado é | O valor máximo de uso de memória do sistema atende ao limite especificado. |
Memória do sistema: Disponível é | O uso de memória do sistema disponível para o mongod ficou abaixo do limite especificado. |
Memória do sistema: o máximo disponível é | A quantidade máxima de memória do sistema disponível cai abaixo do limite especificado. |
A % de espaço em disco usado no modelo de dados é | Porcentagem de espaço em disco usado em qualquer partição que contém os dados da coleção MongoDB. |
A % máxima de espaço em disco usado no modelo de dados é | A porcentagem máxima de espaço em disco usada em qualquer partição que contém os dados da collection MongoDB excede o limite especificado. |
A % de espaço em disco usado na partição do índice é | Porcentagem de espaço em disco usado em qualquer partição que contém os dados de índice MongoDB. |
A % máxima de espaço em disco usado na partição de índice é | A porcentagem máxima de espaço em disco usada em qualquer partição que contém os dados de índice MongoDB excede o limite especificado. |
A % de espaço em disco usado na partição do diário é | Porcentagem de espaço em disco usado na partição que contém o diário MongoDB, se o registro no diário estiver habilitado. |
A % máxima de espaço em disco usado na partição do Diário é | A porcentagem máxima de espaço em disco usada na partição que contém o diário MongoDB excede o limite especificado. |
A rede do sistema de entrada é | O número de bytes por segundo enviados para o host do reconhecimento de data center atende ao limite especificado. |
A entrada máxima da rede do sistema é | O número máximo de bytes enviados para o MongoDB atende ao limite especificado. |
A saída de rede do sistema é | O número de bytes por segundo enviados do host do reconhecimento de data center atende ao seu limite especificado. |
A saída máxima da rede do sistema é | O número máximo de bytes enviados do MongoDB atende ao limite especificado. |
Observação
Você pode criar Atlas Charts para uma seleção dessas métricas no Ops Manager.
Na visualização Deployment do projeto do Ops Manager, clique na guia List .
Clique no processo que você deseja monitorar.
Clique na aba Status.
Role para baixo até a lista de métricas disponíveis e selecione a(s) métrica(s) desejada(s) para o gráfico.
Para saber mais sobre como criar Atlas Charts para métricas de host no Ops Manager, consulte Visualize Métricas de Implantação e clique na aba MongoDB Process Metrics .
Alertas de conjunto de réplicas
Você pode definir alertas sobre o status do primário e o número de membros saudáveis em um conjunto de réplicas. As condições do conjunto de réplicas incluem:
Condição | Gatilho de alerta |
---|---|
Conjunto de réplicas eleito um novo primary | Um conjunto elege um novo primário. Cada vez que o MongoDB Ops Manager recebe um ping, ele inspeciona a saída do método rs.status() do conjunto de réplicas para o status de cada membro do conjunto de réplicas. A partir dessa saída, o MongoDB Ops Manager determina qual membro do conjunto de réplicas é o principal. Se o primário encontrado nos dados de ping for diferente do primário atual conhecido pelo MongoDB Ops Manager, esse alerta será acionado. Receber esse alerta nem sempre média que o conjunto elegeu uma nova primária. Esse alerta também pode trigger quando a mesma primária for reeleita. Isso pode acontecer quando o Ops Manager processa um ping no meio de uma eleição. |
O conjunto de réplicas não tem primário | Um conjunto de réplicas não tem um primary. Especificamente, quando nenhum dos membros de um conjunto de réplicas tem o status Se o monitoramento coleta dados durante uma eleição para primário, esse alerta pode enviar um falso positivo. Para evitar esses falsos positivos, defina o intervalo de configuração de alerta after waiting (na seção Send to da configuração). Para obter soluções, consulte Corrigir primário perdido. |
As métricas do conjunto de réplicas incluem:
Métrica | Gatilho de alerta |
---|---|
O número de membros saudáveis é | Um conjunto de réplicas tem menos membros íntegros do que o limite especificado. |
O número de membros não íntegros é | Um conjunto de réplicas tem mais membros não íntegros do que o limite especificado. |
O número de eleições na última hora é > X | O número de eleições que ocorreram na última hora excedeu o valor de X especificado pelo usuário. O valor de X é definido quando você cria o alerta. Esse alerta pode indicar que a replicação do cluster não está em um estado saudável, conforme evidenciado por eleições constantes. |
Observação
Um membro do conjunto de réplicas é considerado íntegro se você executar rs.status() para esse conjunto de réplicas e o resultado retornar PRIMARY
ou SECONDARY
para esse membro. Os secundários e árbitros ocultos não são contados.
Alertas de cluster fragmentados
Você pode definir um alerta para um mongos
ausente em um cluster fragmentado. As condições de cluster fragmentado incluem:
Condição | Gatilho de alerta |
---|---|
O cluster não tem um mongos ativo | MongoDB Ops Manager não pode alcançar nenhum mongos para o cluster. |
Alertas de agentes
Você pode definir alertas para o status ou o controle de versão do agente. As condições do agente incluem:
Condição | Gatilho de alerta |
---|---|
A automação está inativa | Nenhuma automação é detectada por pelo menos 1 minuto. Em operação normal, a automação envia um ping ao Ops Manager aproximadamente uma vez a cada 10 segundos. Se o Ops Manager não receber um ping por pelo menos 1 minuto, este Atlas Triggers será acionado. Este alerta Atlas Triggers somente se a automação estiver gerenciando um processo MongoDB ou módulo de agente. |
O monitoramento está inativo | Nenhum monitoramento é detectado por pelo menos 7 minutos. Em operação normal, o monitoramento envia um ping ao gerente de operações aproximadamente uma vez por minuto. Se o gerente de operações não receber um ping por pelo menos 7 minutos, esse alerta será acionado. No entanto, esse alerta nunca é acionado para um projeto que não tenha hosts configurados. IMPORTANTE: quando o monitoramento está inativo, o MongoDB Ops Manager não aciona outros alertas para nenhum host. Por exemplo: se um host estiver inativo, não haverá monitoramento para enviar dados ao MongoDB Ops Manager que possam trigger novos alertas. |
O monitoramento não tem a versão mais recente | O monitoramento não está executando a versão mais recente do software. |
O backup está inativo | O backup de um projeto com pelo menos um conjunto de réplicas ativas ou cluster está inativo há mais de 1 hora. Para resolver este alerta:
|
O backup não tem a versão mais recente | O backup não está executando a versão mais recente do software. |
O backup tem muitas falhas de chamada em conferência | A topologia do cluster conhecida pelo monitoramento não corresponde à configuração de backup das chamadas em conferência que o backup faz. O número de tentativas atende ao limite especificado na configuração Você pode usar este alerta apenas como um alerta global . |
alerta de backup
Você pode definir alertas para oplog de backup, ressincronização e inconsistências. As condições de backup incluem:
Condição | Gatilho de alerta |
---|---|
O oplog de backup está atrasado | Os dados de oplog mais recentes recebidos pelo MongoDB Ops Manager têm mais de 75 minutos. Para resolver esse alerta, consulte Corrigir problemas de oplog no backup. |
O backup exige uma ressincronização | O processo de replicação de um backup fica muito atrás do oplog para se atualizar. Isso ocorre quando o host substitui as entradas de oplog que o backup ainda não replicou. Quando isso acontecer, você deverá ressincronizar o backup, conforme descrito no procedimento Ressincronizar um backup. Além disso, verifique o registro de backup correspondente. Se você ver um teste de "ponto comuns com falha", uma das seguintes situações pode ter acontecido.
|
A configuração de backup inconsistente foi detectada | O Ops Manager detectou que a configuração de um backup não corresponde à configuração da implantação do MongoDB que ele faz backup. Para resolver esse alerta, consulte Corrigir backup inconsistente. |
A contagem inconsistente de snapshots do cluster é... | O Ops Manager falha um número consecutivo de vezes para tirar com êxito um snapshot do cluster. Este alerta é acionado quando o número de tentativas atinge o limite especificado. O texto de alerta pode conter o motivo do problema. Problemas comuns incluem:
|
Não foi possível atribuir o backup a um daemon de backup | Uma tarefa de backup não se vincula a um Backup Daemon. Por exemplo, os motivos pelos quais um tarefa pode não conseguir incluir, mas não estão limitados a:
Você pode usar este alerta apenas como um alerta global . |
O backup atingiu um número alto de tentativas | Envia um alerta se a mesma tarefa falhar repetidamente. Isso pode acontecer, por exemplo, durante a manutenção. Verifique o registro de tarefas correspondente para ver se há uma mensagem de erro explicando o problema. Entre em contato com o Suporte do MongoDB se precisar de ajuda para interpretar a mensagem de erro. Você pode usar este alerta apenas como um alerta global . |
O backup está em um estado inesperado | Algo inesperado aconteceu e o estado de backup para o conjunto de réplicas é No caso de um alerta Você pode usar este alerta apenas como um alerta global . |
O conjunto de réplicas tem um snapshot atrasado | Um snapshot falhou ao ser concluído antes do início do próximo snapshot. Verifique o registro da tarefa na interface de administração do Ops Manager em busca de erros. Você pode usar este alerta apenas como um alerta global . |
A transferência de sincronização da fatia não avançou em... | Uma sincronização inicial começou, mas posteriormente foi paralisada. Problemas que podem causar isso incluem, mas não estão limitados a:
Você pode usar este alerta apenas como um alerta global . |
A tarefa de backup está ativa há... | Uma tarefa de backup funcionou por mais horas em um período de 24 horas do que o limite especificado. Diferentes tarefas de backup compartilham Backup Daemons ou armazenamentos de snapshots. O tempo de execução da tarefa de backup pode variar. Tarefas de backup de longa duração podem fazer com que as tarefas restantes fiquem para trás ou falhem. Defina essa métrica para quanto tempo você espera que os backups levem para serem concluídos em seu sistema. Você deve verificar o registro de tarefas correspondente para ver se há mensagens de erro. Entre em contato com o Suporte do MongoDB se precisar de ajuda para interpretar a mensagem de erro. Você pode usar este alerta apenas como um alerta global . |
Alertas de connector BI
Essas condições de alerta se aplicam ao uso do BI Connector com o Ops Manager.
Alertas de usuário
Você pode definir alertas para adição, remoção e alterações de função de usuários. As condições do usuário incluem:
Condição | Gatilho de alerta |
---|---|
O usuário entrou no projeto | Um novo usuário se junta ao projeto. |
O usuário sai do projeto | Um usuário sai do projeto. |
O usuário teve sua função alterada | As funções de um usuário foram alteradas. |
Alertas de projeto
Você pode definir alertas para a aprovação do usuário e a configuração da autenticação. As condições do projeto incluem:
Condição | Gatilho de alerta |
---|---|
Os usuários não têm a autenticação de dois fatores habilitada | O projeto tem usuários que não configuraram a autenticação de dois fatores. |
alerta de verificação de segurança atualizados | Os alertas da verificação de segurança do projeto foram alterados. |