修复复制延迟
2024 年 8 月 30 日以后,Cloud Manager 将不再支持 MongoDB 3.6 和 4.0 的自动化、备份和监控。请升级您的 MongoDB 部署或迁移到 Atlas。
在时间 T
,对副本集ABC
的指定从节点应用的最后一次写入操作晚于对从节点(secondary node from replica set)节点应用的最近主节点 (primary node in the replica set)操作。
警报条件
您可以在项目级警报设置页面配置触发警报的警报条件。
要了解详情有关警报条件的更多信息,请参阅复制延迟是。
常见触发器
空闲副本集。报告的复制延迟时间实际上只是自上次写入以来的时间。在主节点上的最后一次操作时间和从节点收到的最后一次操作时间之间计算,得出复制延迟时间。如果副本集每 10 分钟才写入一次,则复制延迟时间将是主节点写入操作之后 10 分钟、下一次写入操作复制到从节点之前 10 分钟。
从节点配置不足,这意味着它需要更多分配的资源,并且无法跟上主节点的速度(如果使用从节点进行读取扩展,则很常见)。
在主节点和从节点之间存在带宽不足或某种其他网络问题。
解决眼前的问题
调整该警报的设置,以仅在复制延迟持续时间超过 2 分钟时触发。这会减少误报的可能性。
解决主节点和从和节点之间的网络问题。
要了解更多信息,请参阅 MongoDB 手册中的副本集疑难解答。
实施长期解决方案
增加主节点和从节点之间的带宽。
将从节点移动(或原地升级)到与当前主节点配置相同(或更好)的计算机上。
监控您的进度
查看以下图表来监控您的进度:
Network
监控网络指标以追踪网络性能。
Replication Headroom
监视复制空间以确定从节点是否可能脱离 oplog。
Replication Lag
监视复制延迟以确定从节点是否可能脱离 oplog。
要了解更多信息,请参阅查看部署指标。