Docs 菜单
Docs 主页
/
MongoDB Enterprise Kubernetes Operator
/ /

在 Operator 集群正常运行的情况下恢复MongoDB Ops Manager和 AppDB

如果运行 Ops Manager 应用程序实例或应用程序数据库节点的 Kubernetes 集群出现故障,但 Operator 集群可用,则您可以使用 Kubernetes Operator 根据以下场景重新配置应用程序数据库副本集和 Ops Manager 应用程序实例的部署:

  • 如果部分或全部MongoDB Ops Manager应用程序实例发生故障,也不会丢失任何数据,因为MongoDB Ops Manager应用程序是无状态的。 要提高MongoDB Ops Manager应用程序的可用性,请将新的MongoDB Ops Manager应用程序实例添加到已配置且可用Kubernetes成员集群中,或者添加新的Kubernetes集群来运行MongoDB Ops Manager应用程序实例。

  • 如果只有少数副本集节点发生故障,并且副本集中的大多数节点可用,则在协调过程中,Kubernetes Operator 会忽略发生故障的 Kubernetes 集群,并且应用程序数据库将保持在可写入状态。

    使用 spec.applicationDatabase.clusterSpecList设置将应用程序数据库的副本集节点添加到已配置且可用的成员 Kubernetes 集群,或者添加在其上部署应用程序数据库的失败副本集成员的新 Kubernetes 集群。您还可以在出现故障的 Kubernetes 集群上缩减副本集的节点,以重新配置副本集,使其不再包含这些节点。

  • 如果副本集的大多数节点发生故障,则副本集无法形成投票多数来选举主节点。要了解详情,请参阅副本集部署架构。在这种情况下,如果应用程序数据库的副本集中至少有一个节点保持可用,则不会丢失任何数据。由于副本集中没有主节点,因此必须强制重新配置副本集以添加新的副本集节点。这些节点将形成投票多数,允许副本集选举主节点。新的应用程序数据库实例将与健康节点同步以接收数据。

  • 如果托管应用程序数据库副本集节点的所有 Kubernetes 成员集群都发生故障,则会导致不可逆的数据丢失(Ops Manager 不会备份应用程序数据库)。如果可能,请使用奇数个 Kubernetes 成员集群,并跨数据中心、区域或 Kubernetes 集群分布应用程序数据库节点。要了解更多信息,请参阅分布在两个或多个数据中心的副本集。

后退

MongoDB Ops Manager和 AppDB 资源的灾难恢复