Docs 菜单
Docs 主页
/
MongoDB Atlas
/

查看集群指标

在此页面上

  • 查看指标
  • 重要指标
  • 监控数据存储粒度
  • 突发报告
  • 免费集群和共享集群监控注意事项
  • 无服务实例监控注意事项
  • 管理标签

Atlas 收集并显示服务器、数据库和 MongoDB 进程的指标。

监控集群指标以发现性能问题并确定当前集群是否满足您的要求。有关可用于监控集群的指标的更多信息,请参阅查看可用指标

注意

Atlas 在任何给定时间在 Metrics(指标)页面上显示的服务器数量取决于浏览器屏幕大小。使用 Toggle Members(切换节点)部分控制 Atlas 显示哪些服务器。将鼠标悬停在 SP 图标可找出它们代表的服务器。

查看项目概览
Clusters视图显示 Atlas 项目中的所有集群,并提供每个集群的核心指标。 您还可以在Overview标签页上查看特定集群的核心指标。
查看 Atlas 无服务器实例指标
查看 Atlas 项目中特定无服务器实例的指标。
查看 Atlas 副本集指标
查看 Atlas 项目中特定副本集的衡量指标。
查看 Atlas 分片集群指标
查看 Atlas 项目中特定分片集群的指标。
查看 MongoDB 进程
查看 Atlas 集群中特定 MongoDB 进程的指标。
查看实时性能指标
查看项目中特定 Atlas 集群的实时性能指标。
查看 Atlas Search 指标
查看具有至少一个活动 Atlas Search 索引的 Atlas 集群的 Atlas Search 指标。

您可以监控以下指标,以快速评估集群的运行状况。

图表
说明

Connections

指示集群活动连接总数的数字。

监控连接以确定当前的连接限制是否足够。如有必要,请升级集群层。

要了解详情,请参阅修复连接问题修复丢失的主节点

Disk IOPS

指示每秒输入操作次数的数字。

监控磁盘 IOPS 是否接近预配的最大 IOPS。确定集群是否可以处理将来的工作负载。

要了解更多信息,请参阅修复 IOPS 问题修复丢失的主节点

Disk Usage

指示集群已用磁盘空间的总字节数。

监控集群的数据和 MongoDB 操作数据(缓冲区、事务日志和运行日志文件)的总大小。

要了解更多信息,请参阅修复存储问题

Query Targeting

指示在 MongoDB 上运行的读取操作的效率的数字。

监控查询定位指标,以识别无效查询。

Atlas Search 进程 () mongot 用来保持 Atlas Search 索引更新的变更流游标可以提高查询目标比率,如果比率很高,则会触发 查询定位警报。

要了解更多信息,请参阅修复查询问题

Normalized System CPU

一个数字,表示节点上所有进程的 CPU 使用率,通过除以 CPU 核心数,调整范围为 0%-100%。

监控 CPU 使用情况,以确定是否从磁盘而不是内存中检索数据。

如果您无法查看触发警报的使用情况,请单击相关时段并拖动鼠标,放大 Normalized System CPU 图表。通过更高分辨率的视图,您可能会发现在概述中看不到的 CPU 使用量尖峰。

要了解更多信息,请参阅修复 IOPS 问题修复丢失的主节点修复 CPU 使用率问题。

Oplog GB/Hour

指示主节点每小时生成的 oplog 数据的平均速率(以千兆字节为单位)的数字。

监控 oplog 数据,确定是否必须增加 oplog 大小。

要了解更多信息,请参阅修复 Oplog 问题

Util %

向磁盘发出请求并由磁盘提供服务的时间百分比。该指标包括来自任何进程的请求,而不仅仅是 MongoDB 进程。

监控利用率是否较高。确定是否增加预配的 IOPS 或升级集群。

要了解更多信息,请参阅修复 IOPS 问题

Atlas 以各种粒度级别存储指标数据。 对于每个粒度级别,Atlas 都会将指标计算为下一个更细粒度级别所报告指标的平均值。

例子

在60分钟时间段结束时,Atlas 会生成1小时指标报告。 Atlas 将1小时报告中的“连接”指标值计算为该小时内生成的60 1分钟报告中所有“连接”指标值的平均值。

除非您有高级监控资格,否则 Atlas 以 1 分钟的粒度收集指标数据。

当指标数据达到保留期结束时,Atlas 会将其压缩为下一个更宽粒度级别的单个单位。

例子

收集48小时的数据后,Atlas 会将每组60分钟压缩为以小时为单位的数据。 63天后,Atlas 将每组24小时压缩为以天为单位。

许多指标都有对应的突发报告。 给定粒度的突发报告指标的值是 Atlas 在该时间间隔内以下一个更细粒度级别生成的所有报告的最大报告值。

例子

磁盘 IOPS 指标有一个等效的最大磁盘 IOPS。 Atlas 以 1 小时为间隔报告“最大磁盘 IOPS”,这是 Atlas 在该小时内生成的 60 份 1 分钟报告中的最高“最大磁盘 IOPS”值。 Atlas 以 1 天的间隔报告“最大磁盘 IOPS”,作为 Atlas 在该小时生成的 24 份 1 小时报告中的最高“最大磁盘 IOPS”值。

如果您至少有一个 M40 或更大的集群,Atlas 会自动为项目中的所有集群启用高级监控。启用高级监控后,Atlas 会以 10 秒的粒度收集指标数据。项目中的所有集群都会保持启用高级监控状态,直到您降级或终止最后一个 M40 集群。

Atlas 将指标数据保留一段时间,具体时间取决于数据的粒度:

数据周期
保留期限

10 秒

8 小时

1分钟

48 小时

5 分钟

48 小时

1 小时

63 天

1 天

永远

仅限高级监控

Atlas 保留所有特定于数据库的统计数据。MongoDB 日志数据最大保留率为每 2 分钟 2000 行。

注意

历史指标结转

如果创建的新群集与之前删除的集群具有相同的部署类型、名称和项目,则已删除集群的历史指标会转移到新集群。

  • M0 免费集群和 M2/M5 共享集群支持可用指标和图表的子集。有关 M0/M2/M5 集群限制的完整文档,请参阅 Atlas M0(免费集群)、M2 和 M5 限制。

  • Atlas暂停对M0免费集群的监控,这些集群已有7天没有连接活动。通过Atlas Administration API、驱动程序mongosh数据浏览器成功连接后,监控就会恢复。

  • 无服务器实例支持可用指标和图表的子集。有关无服务器实例限制的完整文档,请参阅无服务器实例限制。

您可以从 Clusters(数据库部署)页面或 Overview(概述)页面中添加标签,查看现有标签以及管理标签。要了解更多信息,请参阅Clusters(数据库部署)页面中管理集群标签Overview(概述)页面中的管理集群标签

重要

请勿在资源标记中包含敏感信息,如个人身份信息 (PII) 或受保护的医疗信息 (PHI):其他 MongoDB 服务(例如账单服务)可以访问资源标记。资源标记应用于隐私信息和敏感数据。要了解详情,请参阅敏感信息

后退

CPU 使用率