Docs 菜单
Docs 主页
/
MongoDB Ops Manager
/ / /

修复主机故障

在此页面上

  • 警报条件
  • 常见触发器
  • 解决眼前的问题
  • 实施长期解决方案
  • 监控您的进度

在时间 T ,主机X上的监控已有A分钟没有检测到在主机Y端口Z上运行的 mongod进程。

您可以在项目级 警报设置页面配置警报条件以trigger警报。

要了解有关警报条件的更多信息,请参阅主机已关闭。

  • 由于网络问题,无法mongod进程。

  • mongod进程未运行。

  • 主机已下电。

  • 验证运行监控的主机与列为关闭的主机之间的网络通信。 一种方法是通过mongosh

    mongosh <hostname>:<port>

    如果从mongosh连接失败,请尝试基本网络探测(ping)测试:

    ping <hostname>
  • 验证mongod进程正在运行:

    如果进程是从debrpm包安装的,请向服务管理器查询状态:

    sudo service mongod status

    或者,您可以使用ps

    ps aux | grep mongo

注意

Host is down警报不应用于检测所有发生的主机重启情况。 仅当监控运行检查时主机被视为关闭时,才会触发警报。 检查间隔可以为 1 到 3 分钟。

保持托管开机且mongod进程运行。 努力防止出现任何网络问题。

查看以下图表以监控进度:

  • Network

    监控网络指标以追踪网络性能。

要了解更多信息,请参阅查看部署指标。

后退

管理警报