托管系统警报
系统警报是内部运行状况检查,用于监控MongoDB Ops Manager本身的运行状况,包括后端后端数据库、备份守护程序和备份的 部署的运行状况。 MongoDB Ops Manager每五分钟运行一次运行状况检查。
要查看系统警报列表:
单击 Ops Manager 用户界面顶部的 Admin链接。
单击 Alerts 标签页。
单击System Alerts下的Open Alerts链接。
已禁用的系统警报显示为灰色。
如果您具有 Global Owner
或Global Monitoring Admin
角色,则可以修改通知设置或禁用系统警报。
系统警报组件
每个系统警报由三个部分组成:
组件 | 示例 |
---|---|
Atlas Triggers警报的条件 |
|
警报接收者列表 |
|
发送警报的方法 |
|
当启用警报并满足其trigger条件时, MongoDB Ops Manager使用该警报的指定介质向指定收件人发送警报。 有关通知选项的列表,请参阅本页上“ 修改系统警报的通知设置” 过程中的“ 选择警报接收者和传递方法 ”步骤。
默认情况下,Ops Manager 启用 所有 警报,并将警报发送到在Admin Email Address Ops Manager 配置选项 的 字段中指定的 电子邮件 地址。
可用系统警报
Ops Manager 提供以下系统警报:
警报处理
备份
警报类型 | 警报消息 | 说明 |
---|---|---|
OPLOG_TTL_RESIZE | ||
THEFT_FAILED | 当备份作业迁移到新的备份守护程序失败时发送。 备份作业继续在原始备份守护程序上运行。 有关移动作业的更多信息,请参阅作业。 |
备份守护进程
警报类型 | 警报消息 | 说明 |
---|---|---|
DAEMON_DOWN | 当备份守护程序超过 15 分钟未对 Ops Manager 执行 ping 操作时发送。 | |
DAEMON_UP | ||
LOW_HEAD_FREE_SPACE | 当存储备份副本集本地副本的磁盘分区的剩余可用空间少于 1 GB 时发送。 按照修改系统警报的通知设置步骤更改此空间限制。 | |
LOW_HEAD_FREE_SPACE_PERCENT | 当存储备份副本集本地副本的磁盘分区的剩余可用空间少于 10% 时发送。 按照修改系统警报的通知设置步骤更改此百分比。 | |
SUFFICIENT_HEAD_FREE_SPACE |
块存储
警报类型 | 警报消息 | 说明 |
---|---|---|
BALANCER_OFF | ||
BALANCER_ON | 当分片块存储运行分片集群负载均衡器时发送。 您应该禁用分片块存储上的负载均衡器。 要禁用负载均衡器,请参阅禁用负载均衡器。 | |
INSIDE_SPACE_USED_THRESHOLD | ||
OUTSIDE_SPACE_USED_THRESHOLD | 当块存储使用的磁盘空间超过配置的 threshold 设置时发送。 默认阈值是存储块存储的磁盘总容量的85 %。 您可以在mms.alerts.OutsideSpaceUsedThreshold.maximumSpaceUsedPercent 配置中更改MongoDB Ops Manager 值。 |
Cron 作业
Cron 作业状态
数据库进程
警报类型 | 警报消息 | 说明 |
---|---|---|
BACKING_DATABASE_PROCESS_DOWN | 当 Ops Manager 无法连接到后端数据库并运行网络探测(ping)命令时发送。 | |
BACKING_DATABASE_PROCESS_NO_STARTUP_WARNINGS | ||
BACKING_DATABASE_PROCESS_STARTUP_WARNINGS | ||
BACKING_DATABASE_PROCESS_UP |
Log
修改系统警报的通知设置
选择警报接收者和发送方式。
在Send to部分中,配置通知。 要添加通知或收件人,请单击Add并从下面列出的选项中进行选择。 要测试通知,请单击配置通知后显示的测试链接,并确保您正在测试的服务收到该消息。
可以设置哪些警报通知方法取决于警报的范围:
警报通知方法如下:
通知方法 | 项目 | 全局 | 记录 | 说明 | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Ops Manager 项目 | 通过电子邮件或短信向项目中具有特定角色的用户发送该警报。
| |||||||||||||||
Ops Manager 组织 | 通过电子邮件或短信向组织中具有特定角色的用户发送该警报。
| |||||||||||||||
Ops Manager 用户 | 通过电子邮件或短信向 Ops Manager 用户发送警报。
| |||||||||||||||
Ops Manager 团队 | 通过电子邮件或短信向 Ops Manager 用户发送警报。
| |||||||||||||||
SNMP主机 | 指定将在标准端口 重要MongoDB Ops Manager 6.0.0 弃用SNMP警报。 MongoDB Ops Manager 7.0.0 将不包含SNMP警报。 要学习;了解有关其他警报选项的更多信息,请参阅第三方服务集成。 | |||||||||||||||
电子邮件 | 将警报发送到指定的电子邮件地址。 | |||||||||||||||
短信 | 将警报发送到电话号码。 Ops Manager 会删除除 对于国际(非美国)电话号码, 请使用 E.164 标准 格式化电话号码 。示例,对于新西兰,请在电话号码前输入 MongoDB Ops Manager使用位于美国的 Twilio 发送短信。 如果您想使用非美国 电话号码,请尝试使用 Google 语音 电话号码。 配置MongoDB Ops Manager for Twilio集成以使用SMS 。 | |||||||||||||||
将警报发送到 HipChat 聊天室消息流。 输入 HipChat 房间名称和API令牌。 | ||||||||||||||||
将警报发送到 PagerDuty 帐户。仅输入 PagerDuty 集成密钥。 直接在 PagerDuty 中定义升级规则和警报分配。 从 PagerDuty 仪表盘确认 PagerDuty 警报。 PagerDuty Decommissioned 他们在 110 月的 REST API v2018 密钥。如果您有 av1 密钥,则可以继续在MongoDB Ops Manager中使用该密钥。 所有新的 PagerDuty 密钥均使用其REST API v2 ,但MongoDB Ops Manager 不支持其 v2 密钥。如果您没有 REST API v1 密钥,请使用 PagerDuty Events API v1 相反。 | ||||||||||||||||
Webhook | 向端点发送HTTP 帖子 请求以进行编程处理。请求正文包含一个JSON文档,其格式与 Ops Manager API警报资源相同。 要配置此选项,请在“项目设置”页面上配置 Webhook 设置。 要在全局级别使用此方法,请执行以下操作:
Ops Manager 添加了一个名为
Webhook Secret如果您在字段中指定键,MongoDB Ops Manager | |||||||||||||||
将警报发送到 Datadog 帐户作为 Datadog 事件。 首次打开警报时,Ops Manager 会将警报作为“错误”事件发送。 后续更新将作为“信息”事件发送。 当警报关闭时,Ops Manager 会发送“成功”事件。 出现提示时,在API Key下输入您的 DataDog API密钥,然后单击Validate Datadog API Key 。 查找 DataDog API 密钥 在 您的 Datadog 帐户中。 | ||||||||||||||||
管理员 | 将警报发送到 Ops Manager 配置选项中Admin Email Address字段中指定的电子邮件地址。 | |||||||||||||||
全球警报摘要电子邮件 | 将所有全局警报的摘要电子邮件发送到指定的电子邮件地址。 |