监控
安装
监控服务器未启动成功
IP确认MongoDB Ops Manager 服务的 URI 或 解决正确存储在mongo.mongoUri
<install_dir>/conf/conf-mms.properties
文件的 属性中:
mongo.mongoUri=<SetToValidUri>
如果不设置此属性,Ops Manager 将在尝试连接到默认 127.0.0.1:27017URL。
如果服务的 URI 或 IP 地址发生变化,则必须使用新地址更新该属性。 例如,如果在没有静态 IP 地址的系统上部署,或者在没有固定 IP 的 EC2 上部署,然后重新启动 EC2 实例,请更新地址。
如果 URI 或 IP 地址发生变化,则访问该服务的每个用户还必须更新用于连接的 URL 以及客户端monitoring-agent.config
文件中的地址。
如果使用 Ops Manager <install_dir>/bin/credentialstool
来加密mongo.mongoUri
值中使用的密码,还要将mongo.encryptedCredentials
密钥添加到<install_dir>/conf/conf-mms.properties
文件中,并将该属性的值设置为 true:
mongo.encryptedCredentials=true
警报
有关警报条件的解决方案,另请参阅解决警报。
无法关闭电子邮件通知
至少有两种方法可以关闭警报通知:
从 Ops Manager 帐户中删除部署。 请参阅停止管理和/或监控一个部署。
禁用或删除警报配置。 请参阅配置警报设置。
关闭特定主机的警报。 请参阅禁用特定进程的警报。
接收重复警报
如果通知电子邮件列表包含多个电子邮件组,则一个或多个人可能会收到同一警报的多个通知。
收到“主机打开文件限制下限”或“打开文件过多”错误消息
这些错误消息显示在 Deployment页面上的主机名称下。 如果可用连接数未达到 Ops Manager 定义的最小值,则会出现这些连接。 这些错误不是由 mongos
实例生成的,因此不会出现在mongos
日志文件中。
监控将逐台主机的打开文件描述符和连接数与最大连接数限制进行比较。 最大打开文件描述符 ulimit 参数直接影响可用服务器连接数。 该代理会计算是否存在足够的连接来满足 Ops 经理定义的最小值。
在网络探测(ping)文档中,对于每个节点及其serverStatus.connections
值,如果current
值加上available
值的总和小于为受监控主机设置的maxConns
配置值,则监控将发送Host has low open file limits或Too many open files消息发送到 Ops Manager。
Ping 文档是监控发送到 Ops Manager 的数据。 要查看 网络探测(ping)文档,请执行以下操作:
要使用此功能,您必须:
单击 Deployment 页面。
单击主机名称。
单击 Last Ping(连接)。
为防止此错误,建议您将ulimit
打开文件设置为64000
。 我们还建议将mongosh
中的maxConns
命令至少设置为推荐设置。
要了解更多信息,请参阅MongoDB ulimit 参考页面和MongoDB maxConns 参考页面。
部署
监控无法收集数据
造成此状态的可能原因:
由于网络限制或问题(即 防火墙、代理、路由。)
您的数据库正在使用 TLS运行。 您必须全局或按主机启用TLS 。 要了解更多信息,请参阅配置 MongoDB Agent 以使用 TLS和为部署启用 TLS。
您的数据库正在使用身份验证运行。 您必须为 Ops Manager 提供主机的身份验证档案。 请参阅配置 MongoDB 身份验证和授权。
部署不可见
以下因素可能会导致监控检测部署出现问题:
未添加部署
要解决此问题,请执行以下操作:
单击 Deployment(连接)。
单击 Processes 标签页
单击 Add Deployment(连接)。
在New Deployment窗口中,指定以下值:
部署类型
内部主机名
内部端口
如果适用:
添加数据库用户名和密码。
启用TLS以与您的监控连接。
注意
添加(或删除)部署时,无需重新启动监控。
意外重复 mongod
如果您在崩溃后添加部署并重新启动监控,则可能在Deployment页面上看不到主机名。 Ops Manager 会将部署检测为重复项并抑制其数据。
要重置:
单击 Settings(连接)。
单击 Project Settings(连接)。
单击 Reset Duplicates(连接)。
监控无法检测到部署
如果您的部署存在于多个数据中心,请确保所有监控都能发现您的所有部署。
无法删除部署
在极少数情况下,会关闭mongod
并重新配置副本集。 无法删除已关闭的部署,并会返回以下错误消息:
警告
无法删除此部署,因为它已启用备份。
请联系MongoDB 支持部门,获取有关删除这些部署的帮助。
项目
有关项目的其他信息
创建项目以监控服务器、代理、用户和其他资源的其他隔离系统或环境。
例子
防火墙可能会将您的部署分隔到两个或多个环境中。 在这种情况下,您需要两个或更多单独的 Ops Manager 项目。
API密钥对于每个项目都是唯一的。 每个项目都需要自己的代理和相应的API密钥。 在每个项目中,代理需要能够连接到项目中它监控的所有主机。
要了解有关创建和管理项目的更多信息,请参阅项目。