修复主机故障
MongoDB Ops Manager v6.0 将于 2025 1 月 EOL。 尽快升级到更高的MongoDB Ops Manager版本。
在时间 T
,主机X
上的监控已有A
分钟没有检测到在主机Y
端口Z
上运行的 mongod进程。
警报条件
您可以在项目级 警报设置页面配置警报条件以trigger警报。
要了解有关警报条件的更多信息,请参阅主机已关闭。
常见触发器
解决眼前的问题
验证运行监控的主机与列为关闭的主机之间的网络通信。 一种方法是通过
mongosh
:mongosh <hostname>:<port> 如果从
mongosh
连接失败,请尝试基本网络探测(ping)测试:ping <hostname> 验证mongod进程正在运行:
如果进程是从
deb
或rpm
包安装的,请向服务管理器查询状态:sudo service mongod status 或者,您可以使用
ps
:ps aux | grep mongo
注意
Host is down
警报不应用于检测所有发生的主机重启情况。 仅当监控运行检查时主机被视为关闭时,才会触发警报。 检查间隔可以为 1 到 3 分钟。
实施长期解决方案
保持托管开机且mongod进程运行。 努力防止出现任何网络问题。
监控您的进度
查看以下图表以监控进度:
Network
监控网络指标以追踪网络性能。
要了解更多信息,请参阅查看部署指标。