修复主机故障
2024 年 8 月 30 日以后,Cloud Manager 将不再支持 MongoDB 3.6 和 4.0 的自动化、备份和监控。请升级您的 MongoDB 部署或迁移到 Atlas。
在时间 T
,托管X
上的监控已有A
分钟没有检测到在托管Y
端口Z
上运行的mongod进程。
警报条件
您可以在项目级警报设置页面配置触发警报的警报条件。
要了解有关警报条件的更多信息,请参阅主机已关闭。
常见触发器
解决眼前的问题
验证运行监控的主机与列为关闭的主机之间的网络通信。 一种方法是通过
mongosh
:mongosh <hostname>:<port> 如果从
mongosh
连接失败,请尝试基本网络探测(ping)测试:ping <hostname> 验证mongod进程正在运行:
如果进程是从
deb
或rpm
包安装的,请向服务管理器查询状态:sudo service mongod status 或者,您可以使用
ps
:ps aux | grep mongo
注意
Host is down
警报不应用于检测所有发生的主机重启情况。 仅当监控运行检查时主机被视为关闭时,才会触发警报。 检查间隔可以为 1 到 3 分钟。
实施长期解决方案
保持托管开机且mongod进程运行。 努力防止出现任何网络问题。
监控您的进度
查看以下图表以监控进度:
Network
监控网络指标以追踪网络性能。
要了解更多信息,请参阅查看部署指标。