解析警报
Atlas会根据警报设置中配置的数据库和服务器条件发出警报。 当某个条件触发警报时, Atlas会在集群上显示警告符号并发送警报通知。 警报设置决定了通知方法。 Atlas会继续定期发送通知,直到问题解决或您删除或禁用警报。 您应该解决眼前的问题,实现长期解决方案,并查看指标以监控进度。
注意
如果与 VictorOps、OpsGenie 或 DataDog 集成,则可以在Atlas中接收来自这些第三方监控服务的信息警报。 但是,您必须在每个外部服务中解决这些警报。
查看警报
您可以在 Organization Alerts页面查看所有警报、警报设置和已删除的警报。 要学习;了解更多信息,请参阅警报工作流程。
要查看所有打开的警报:
要使用Atlas CLI列出指定Atlas项目的所有警报,请运行以下命令:
atlas alerts list [options]
要返回使用Atlas CLI指定的项目中一个警报的详细信息,请运行以下命令:
atlas alerts describe <alertId> [options]
要学习;了解有关上述命令的语法和参数的更多信息,请参阅 Atlas警报列表和Atlas 警报描述的Atlas CLI文档。
您可以在 Project Alerts 页面中查看打开的警报、关闭的警报和警报设置。Atlas 会为出现在 Open 标签页上的所有警报发送通知。要了解更多信息,请参阅警报工作流程。
要使用 Atlas 用户界面查看所有打开的警报,请执行以下操作:
在 Atlas 中,转到 Project Alerts(项目设置)页面。
如果尚未显示,请从导航栏上的 Organizations 菜单中选择包含所需项目的组织。
如果尚未显示,请从导航栏的Projects菜单中选择所需的项目。
执行以下步骤之一:
单击导航栏中的 Project Alerts 图标。
在 Projects 菜单旁边,展开 Options 菜单,单击 Project Settings,然后单击侧栏中的 Alerts。
将显示项目警报页面。
确认警报
要使用Atlas CLI确认指定项目的一个警报,请运行以下命令:
atlas alerts acknowledge <alertId> [options]
要学习;了解有关命令语法和参数的更多信息,请参阅Atlas CLI文档以了解Atlas 警报确认。
要使用 Atlas 用户界面确认警报,请执行以下操作:
在 Atlas 中,转到 Project Alerts(项目设置)页面。
如果尚未显示,请从导航栏上的 Organizations 菜单中选择包含所需项目的组织。
如果尚未显示,请从导航栏的Projects菜单中选择所需的项目。
执行以下步骤之一:
单击导航栏中的 Project Alerts 图标。
在 Projects 菜单旁边,展开 Options 菜单,单击 Project Settings,然后单击侧栏中的 Alerts。
将显示项目警报页面。
当你确认警报时,Atlas 不会再发送通知,直到确认期结束、你解决警报状况或取消确认警报为止。如果警报条件在确认期间结束,Atlas 会发送通知。
取消确认警报
你可以取消确认之前确认的警报。取消确认活动警报后,Atlas 会恢复定期发送通知,直到问题解决或你删除、禁用或重新确认该警报。
要使用Atlas CLI取消确认指定项目的一个警报,请运行以下命令:
atlas alerts unacknowledge <alertId> [options]
要学习;了解有关命令语法和参数的更多信息,请参阅Atlas CLI文档以了解Atlas 警报取消确认。
要使用 Atlas 用户界面取消确认警报,请执行以下操作:
在 Atlas 中,转到 Project Alerts(项目设置)页面。
如果尚未显示,请从导航栏上的 Organizations 菜单中选择包含所需项目的组织。
如果尚未显示,请从导航栏的Projects菜单中选择所需的项目。
执行以下步骤之一:
单击导航栏中的 Project Alerts 图标。
在 Projects 菜单旁边,展开 Options 菜单,单击 Project Settings,然后单击侧栏中的 Alerts。
将显示项目警报页面。
增加集群容量
要通过增加集群容量来解决警报,请参阅修改集群。
查看所有活动
要查看和过滤组织或项目的操作日志,请参阅查看操作日志。
检索操作日志
特定警报的解决方案
以下部分描述了Atlas警报条件并建议了解决这些条件的步骤。
警报类型 | 说明 |
---|---|
自动伸缩事件,例如集群层变更。 您可以配置Atlas以通知您这些事件。 | |
Atlas Search 进程使用的 CPU 和内存量达到指定阈值。 | |
MongoDB 进程的连接数超出允许的最大值。 | |
分区上已用磁盘空间的百分比达到指定阈值。 | |
副本集未检测到主节点 (primary node in the replica set)节点。 | |
主节点 (primary node in the replica set) 节点集群成员上生成的 oplog 数据量大于集群配置的oplog大小。 | |
MongoDB 进程的 CPU 使用率达到指定阈值。 |