Docs 菜单
Docs 主页
/
MongoDB Ops Manager
/ / /

管理全局警报

在此页面上

  • Overview
  • 查看全局警报
  • 配置全局警报
  • 禁用或启用全局警报配置
  • 默认全局警报

全局警报会同时将相同的警报配置应用于多个项目。 发生警报条件时, MongoDB Ops Manager仅向受影响的项目发送通知。 MongoDB Ops Manager会定期发送通知,直到您解决取消警报。

如果您确认全局警报,Ops Manager 不会向警报的分发列表发送进一步的通知,直到确认期已过或警报解决。如果警报条件在确认期内结束,Ops Manager 会发送解决方案通知。

要访问全局警报,您必须具有 Global Owner角色或Global Monitoring Admin角色。

注意

默认全局警报

当MongoDB Ops Manager启动时,它会创建 默认全局警报配置。 如果删除默认的全局警报配置, MongoDB Ops Manager会在应用程序重新启动时重新创建该配置。

如果您不想接收来自默认全局警报配置的警报,则必须禁用该全局警报配置。

1
2
3
筛选依据:
执行以下操作:
确认
All States下拉列表中选择适当的选项。
项目
Projects框中键入项目名称。
项目标签

Tags框中键入标签的名称。

具有Global Owner角色的用户可以为项目分配标签。

警报类型(仅限打开警报)
Types框中键入警报类型。 仅当存在未处理的警报类型时,该框才会自动填充该类型的警报。
Date
FromTo字段中选择日期。
4

要确认警报,请单击警报行上的Acknowledge ,选择确认的时间段,然后单击Acknowledge 。 Ops Manager 在所选时间段内不再发送通知。

要“撤消”确认并在警报条件仍然适用时再次接收通知,请单击警报行上的Unacknowledge ,然后单击Confirm

1

仅当您具有权限时,Ops Manager 才会显示Admin链接。

2
3

Ops Manager 显示警报配置选项。

4

如果指定标签,则警报仅适用于具有这些标签的项目。 具有Global Owner角色的用户可以为项目分配标签

您可以键入标签或项目的前几个字母,以便在下拉列表中找到它。

5

Alert if部分中,选择目标组件和条件。 有关警报条件的说明,请参阅查看警报条件。

6

如果显示For部分中的选项,则可以筛选警报以应用于目标子集。

matches字段支持正则表达式。 正则表达式必须匹配整个主机名。

例子

要使用正则表达式查找涉及foo的主机名,可以使用以下选项之一筛选主机名:

主机名 描述
matches 查询
开头为 foo
foo.*
endswith foo
.*foo
contains foo
.*foo.*
7

Send to部分中,单击Add以添加通知或收件人。 为帮助消除误报,请设置Atlas Triggers警报之前经过的时间。

要测试 HipChat、Slack 或 PagerDuty 集成,请单击配置通知后显示的test链接。

可以设置哪些警报通知方法取决于警报的范围:

项目警报
仅适用于一个或多个单独的组织和项目。
全局警报
适用于所有组织和项目。
系统警报
适用于 Ops Manager 及其后端数据库的运行状况

警报通知方法如下:

通知方法
项目
全局
记录
说明
Ops Manager 项目

通过电子邮件或短信向项目中具有特定角色的用户发送该警报。

  1. Select Role(s)(选择角色)复选框中选择应接收警报的项目角色,或选择 All Roles(所有角色),这样项目中的所有用户都会接收到警报。

  2. 选择SMS以将这些警报发送到在“帐户”页面中为每个 Ops Manager 项目用户配置的手机号码。

  3. 选择Email以将这些警报发送到在“帐户”页面中为每个 Ops Manager 项目用户配置的电子邮件地址。 默认情况下, Email处于选中状态。

Ops Manager 组织

通过电子邮件或短信向组织中具有特定角色的用户发送该警报。

  1. Select Role(s) 复选框中选择应接收警报的组织角色,或为组织中的所有用户选择 All Roles 以接收警报。

  2. 选择SMS以将这些警报发送到在“帐户”页面中为每个 Ops Manager 组织用户配置的手机号码。

  3. Select Email to send these alerts to the email address configured for each Ops Manager Organization user in their Account page. 默认情况下, Email处于选中状态。

Ops Manager 用户

通过电子邮件或短信向 Ops Manager 用户发送警报。

  • 选择SMS以将这些警报发送到为 Ops Manager 用户帐户配置的手机号码。

  • 选择Email以将这些警报发送到为 Ops Manager 用户帐户配置的电子邮件地址。 默认情况下, Email处于选中状态。

Ops Manager 团队

通过电子邮件或短信向 Ops Manager 用户发送警报。

  • 选择SMS以将这些警报发送到为 Ops Manager 用户帐户配置的手机号码。

  • 选择Email以将这些警报发送到为 Ops Manager 用户帐户配置的电子邮件地址。 默认情况下, Email处于选中状态。

SNMP主机
指定将在标准端口162上接收 v 2 c 陷阱的主机名。 SNMP MIB 文件 可供下载
电子邮件
将警报发送到指定的电子邮件地址。
将警报发送到 HipChat 聊天室消息流。 输入 HipChat 房间名称和API令牌。

将警报发送到组织授权的 Slack 工作场所中的 Slack 渠道。

  • 输入通道名称以及 API 令牌或 Bot 令牌。

  • 要创建 API 令牌,请参阅 API Slack 帐户中的页面。

要了解有关 Slack 中 Bot 用户的更多信息,请参阅 Slack 文档

将警报发送到 PagerDuty 帐户。仅输入 PagerDuty 集成密钥。 直接在 PagerDuty 中定义升级规则和警报分配。

从 PagerDuty 仪表盘确认 PagerDuty 警报。

所有新的 PagerDuty 密钥均使用其 Events API v2 。如果您有 Events API v1 密钥,则可以继续将该密钥与MongoDB Ops Manager一起使用。

Webhook

向端点发送HTTP 帖子 请求以进行编程处理。请求正文包含一个JSON文档,其格式与 Ops Manager API警报资源相同。

要配置此选项,请在“项目设置”页面上配置 Webhook 设置。

要在全局级别使用此方法,请执行以下操作:

  1. 导航至Ops Manager ConfigMiscellaneousAdministration console 标签页。

  2. 更新Webhook URLWebhook Secret设置。

Ops Manager 添加了一个名为X-MMS-Event的请求标头,以区分各种警报状态。此标头的可能值是:

alert.open
警报刚刚打开。
alert.close
警报已解决。
alert.update
先前打开的警报仍处于打开状态。
alert.acknowledge
警报已得到确认。
alert.cancel
警报无效并被取消。
alert.inform
表示信息警报,即时间点事件,例如“主节点当选”。

Webhook Secret如果您在字段中指定键,MongoDB Ops ManagerX-MMS-Signature 会添加请求标头。此标头包含请求正文的 base64 编码的HMAC -SHA-1 签名。 MongoDB Ops Manager 使用提供的密钥创建签名。

将警报发送到 Datadog 帐户作为 Datadog 事件。

首次打开警报时,Ops Manager 会将警报作为“错误”事件发送。 后续更新将作为“信息”事件发送。 当警报关闭时,Ops Manager 会发送“成功”事件。

出现提示时,在API Key下输入您的 DataDog API密钥,然后单击Validate Datadog API Key

查找 DataDog API 密钥 您的 Datadog 帐户中。

管理员
将警报发送到 Ops Manager 配置选项中Admin Email Address字段中指定的电子邮件地址。
全球警报摘要电子邮件
将所有全局警报的摘要电子邮件发送到指定的电子邮件地址。
8
1

仅当您具有权限时,Ops Manager 才会显示Admin链接。

2
3

在特定警报的行上,单击,然后单击Disable

单击然后Enable可随时重新启用警报。

每次 Ops Manager 启动时,它都会为以下条件创建全局警报配置:

  • 块存储作业已达到较高的重试次数

  • 同步切片传输已超过 60 分钟没有进展

  • 不一致的集群快照计数超过 5

  • 备份已关闭

  • 备份会议通话失败次数过多

  • 没有可用的守护进程来执行可查询恢复作业

  • 检测到备份配置不一致

  • 备份需要重新同步

  • 副本集有延迟快照

  • 备份处于意外状态

  • 备份重试次数已达到上限

  • 无法将备份分配给备份守护程序

如果您不想接收来自默认全局警报配置的警报,则必须禁用该全局警报配置。

后退

配置警报设置