Preparar-se para a manutenção de clusters
- A autenticação OAuth 2.0 para acesso programático ao Cloud Manager está disponível como um recurso de visualização.
- O recurso e a documentação correspondente podem mudar a qualquer momento durante o período de Pré-visualização. Para usar a 2.0 autenticação OAuth, crie uma conta de serviço para usar em suas solicitações para a API pública do Cloud Manager .
O Cloud Manager executa uma reinicialização contínua quando você realiza manutenção em nós em um cluster. A automação atualiza os nós em um cluster um a um até que todos os nós sejam atualizados para manter a disponibilidade do cluster durante um período de manutenção.
Antes de realizar a manutenção dos clusters, revise as seguintes considerações e tome ação, se necessário, para manter a disponibilidade do cluster.
Observação
Para saber como a automação executa a manutenção em seus clusters, consulte Como o Cloud Manager executa manutenção em nós de cluster?.
oplog
Tamanho
Cada nó em um cluster é reiniciado em modo standalone antes do início da manutenção. O nó repete as gravações no oplog para alcançar os outros nós quando é adicionado de volta ao cluster após a conclusão da manutenção.
Certifique-se de que o oplog do cluster seja grande o suficiente para armazenar todas as gravações que seu aplicativo pode fazer durante o período de manutenção. Use a opção avançada de sistema replication.oplogSizeMB
para ajustar o tamanho do oplog.
Priority
Todas as conexões de cliente com um nó primário são descartadas quando a manutenção é iniciada nesse nó. As conexões são restabelecidas com o nó primário recém-eleito.
Você pode preferir que um nó em um data center específico se torne o novo nó primário. Edite a configuração do cluster e ajuste a prioridade de cada nó para indicar seu nó primário preferido.
Tolerância a falhas
Os nós em manutenção não oferecem suporte a failover para o cluster. Para conjuntos de réplicas de três membros, se um nó adicional ficar indisponível enquanto um nó estiver em manutenção, o cluster terá perdido a maioria dos nós. O nó primário perde esse status e retorna para se tornar um nó secundário. Um novo primary não pode ser eleito até que a maioria dos nós do cluster esteja disponível.
Para aplicativos de função crítica com altas necessidades de tempo de atividade, considere converter um conjunto de réplicas de três membros para um conjunto de réplicas de cinco membros antes de realizar a manutenção para manter a maioria do cluster caso um nó de cluster adicional fique indisponível durante um período de manutenção.
Observação
Os conjuntos de réplicas de cinco membros ou maiores são mais resilientes e têm menor probabilidade de sofrer perda de maioria durante os períodos de manutenção.
Uma opção mais simples, mas menos resiliente, para aumentar a tolerância a múltiplas falhas é adicionar um árbitro temporário a um conjunto de réplicas de três membros antes de executar a manutenção.
Construções de índice único
A automação cria índices nos nós do cluster, um de cada vez, usando comandos idênticos, mas independentes. Para garantir que as gravações respeitem a qualidade unique
dos campos indexados em um índice único, todas as gravações na coleção no cluster devem ser interrompidas antes de você criar o índice.
Não é possível usar a chave de criptografia de dados (DEK) ou o recurso de configuração de automação no Cloud Manager para criar um índice único de forma contínua porque esses métodos não interrompem as gravações no cluster.
Se o seu caso de uso exigir que você crie novos índices únicos:
Pare todas as gravações na coleção afetada. Para mais informações. consulte db.fsyncLock() no Manual do MongoDB.
Consulte Construir índices sobre conjuntos de réplicas no Manual do MongoDB para criar o índice único de forma contínua.