解析警报
Atlas 会根据警报设置中配置的数据库和服务器条件发出警报。当某个条件触发警报时,Atlas 会在集群上显示警告符号并发送警报通知。警报设置决定了通知方法。 Atlas 会继续定期发送通知,直到问题解决或您删除或禁用警报。您应该解决眼前的问题,实施长期解决方案,并查看指标以监控进度。
注意
如果与 VictorOps、OpsGenie 或 DataDog 集成,则可以在 Atlas 中接收来自这些第三方监控服务的信息警报。但是,您必须在每个外部服务中解决这些警报。
查看通知
确认警报
当你确认警报时,Atlas 不会再发送通知,直到确认期结束、你解决警报状况或取消确认警报为止。如果警报条件在确认期间结束,Atlas 会发送通知。
取消确认警报
你可以取消确认之前确认的警报。取消确认活动警报后,Atlas 会恢复定期发送通知,直到问题解决或你删除、禁用或重新确认该警报。
增加集群容量
要通过增加集群容量来解决警报,请参阅修改集群。
查看所有活动
要查看和过滤组织或项目的操作日志,请参阅查看操作日志。
检索操作日志
特定警报的解决方案
以下部分描述了 Atlas警报条件并建议了解决这些条件的步骤。
警报类型 | 说明 |
---|---|
Atlas Search 进程使用的 CPU 和内存量达到指定阈值。 | |
MongoDB 进程的连接数超出允许的最大值。 | |
分区上已用磁盘空间的百分比达到指定阈值。 | |
副本集中未检测到主节点。 | |
主 节点集群成员上生成的 oplog 数据量大于集群配置的 oplog 大小。 | |
MongoDB 进程的 CPU 使用率达到指定阈值。 |