Docs 菜单
Docs 主页
/
MongoDB Enterprise Kubernetes Operator
/ /

在 Operator 集群正常运行的情况下恢复MongoDB Ops Manager和 AppDB

如果运行Kubernetes MongoDB Ops Manager应用程序实例或应用程序数据库节点的 集群出现故障,但操作符集群可用,则可以使用Kubernetes Operator 根据以下场景重新配置应用程序数据库副本集和MongoDB Ops Manager 应用程序实例的部署:

  • 如果部分或全部MongoDB Ops Manager应用程序实例发生故障,也不会丢失任何数据,因为MongoDB Ops Manager应用程序是无状态的。 要提高MongoDB Ops Manager应用程序的可用性,请将新的MongoDB Ops Manager应用程序实例添加到已配置且可用Kubernetes成员集群中,或者添加新的Kubernetes集群来运行MongoDB Ops Manager应用程序实例。

  • 如果只有少数副本集节点发生故障,并且副本集集中的大多数节点可用,则在协调进程, Kubernetes Operator 会忽略发生故障的Kubernetes集群,并且应用程序数据库将保持在可写入状态。

    使用 spec.applicationDatabase.clusterSpecList设置将应用程序数据库的副本集节点添加到已配置且可用的成员Kubernetes集群,或者添加在其上部署应用程序数据库的失败副本集成员的新Kubernetes集群。 您还可以在出现故障的Kubernetes集群上扩展副本集的节点,以重新配置副本集,使其不再包含这些节点。

  • 如果副本集的大多数节点发生故障,则副本集无法形成投票多数来选举主节点 (primary node in the replica set)节点。 要学习;了解详情,请参阅副本集部署架构。 在这种情况下,如果应用程序数据库的副本集至少有一个节点保持可用,则不会丢失任何数据。 由于副本集没有主节点 (primary node in the replica set)节点,因此必须强制重新配置副本集以添加新的副本集节点。 这些节点将形成投票多数,允许副本集选举一个主节点 (primary node in the replica set)节点。 新的应用程序数据库实例将与健康节点同步以接收数据。

  • 如果托管应用程序数据库副本集节点的所有Kubernetes成员集群都发生故障,则会导致不可逆的数据丢失( MongoDB Ops Manager不会备份应用程序数据库)。 如果可能,请使用奇数个Kubernetes成员集群,并跨数据中心、区域或Kubernetes集群分布应用程序数据库节点。 要学习;了解更多信息,请参阅分布在两个或多个数据中心的副本集。

后退

灾难恢复