Docs 菜单
Docs 主页
/
MongoDB Atlas
/ /

查看可用指标

您可以查看以下指标来监控集群。所有硬件指标都包括最大值的指标或单独图表。

重要

可用的指标取决于用户角色和集群类型。

注意

目前,无服务器实例指标不支持任何第三方服务(例如 Datadog)。

衡量标准
说明

Asserts

显示以下信息:

  • ASSERT_REGULAR 显示所选样本周期内每秒触发的常规断言的平均速率。

  • ASSERT_WARNING 显示所选样本周期内每秒发出警告的平均速率。

  • ASSERT_MSG 显示所选样本周期内每秒消息断言的平均速率。这些内部服务器错误有一个定义明确的文本字符串。Atlas 会记录这些错误的堆栈跟踪。

  • ASSERT_USER 显示所选样本周期内每秒用户断言的平均速率。该指标包括用户生成的断言,如磁盘空间不足或重复键错误。

监控器断言跟踪在尝试读取或写入数据时发生的错误数量。检查服务器日志,找出错误源。

Avg Object Size

显示数据库中所有集合的平均对象大小。

监视对象大小以追踪对象的大小并更好地了解数据库空间。

Cache Activity

显示以下信息:

  • readInto (副本集)或 cache read into(分片集群)显示从磁盘读取到内存的用于服务查询的数据速率,以字节每秒为单位。

  • writtenFrom (副本集)或 cache written from(分片集群)显示从内存写入到磁盘用于服务写操作的数据速率,以字节每秒为单位。

监控 MongoDB 缓存,它将频繁访问的数据存储在内存中,以便更快地为查询提供服务。

Cache Ratio

显示缓存填充率和脏填充率指标。

缓存填充率衡量缓存处理请求的能力。计算方法是使用当前缓存中的字节数除以配置的最大字节数,以百分比表示。较高的缓存填充率表示大多数数据请求都是从内存中处理的,这可以提高查询性能并减少磁盘 I/O。

脏填充率表示脏字节(即在内存中修改但尚未写入磁盘的页面)占缓存总量的比例。较高的脏填充率表示有大量数据正在等待写入磁盘,这可能会影响性能。在监控写入密集型工作负载时使用此指标,以确保数据持久性。

Cache Usage

显示以下信息:

  • dirty (副本集)或 cache dirty(分片集群)显示内存中缓存的用于读取和写入的脏数据字节总数。

  • used (副本集)或 cache used(分片集群)显示内存中缓存的用于读取和写入的字节总数。

这些指标包括工作集中的索引和数据。

缓存使用率持续较高表明 RAM 对于您的工作负载而言太小。请优化查询以避免频繁地读取磁盘。如果写入操作使缓存使用率较高,请对其进行限制。

Catalog

显示以下信息:

  • total databases 显示非系统数据库的总数。

  • total collections 显示所有非系统数据库的集合总数。

  • total views 显示所有非系统数据库的视图总数。

  • total indexes 显示所有非系统集合的索引总数。

在升级集群层时,监控目录计数以防止过多的数据库、集合、视图或索引导致启动失败。

Collections

显示数据库中的集合数。

监控集合以确定重新启动时间、连续备份性能和稳定性。

Connections (无服务器实例/副本集)或 connection (分片集群)

显示集群的总活动连接数。

监控连接以确定当前的连接限制是否足够。如有必要,请升级集群层。

Cursors

显示以下信息:

  • totalOpen 显示服务器为客户端维护的游标数量。

  • totalTimedOut 显示所选采样周期内每秒游标超时的平均速率。

监控游标以关闭不必要的游标,并减小应用程序中的超时配置。

DB Storage

显示以下信息:

  • storageSize (副本集)或 db storage size (分片集群)显示为所有数据库中的文档存储分配的磁盘存储空间总量。

  • Data Size (无服务器实例)、dataSize(副本集)或 db data size(分片集群)显示您存储的数据使用的存储空间量(以字节为单位)。

  • db data size without system 显示非系统数据库中文档数据(包括填充因子)的总大小(以字节为单位)。

Atlas 默认下每 20 分钟检索一次数据库指标,但会在必要时调整频率以减少对数据库性能的影响。

监控存储空间,以确定是否使用磁盘自动伸缩还是手动增加磁盘大小。您还可以监控此指标以验证备份账单。

Disk IOPS

显示每秒的输入操作次数。

监控磁盘 IOPS 是否接近预配的最大 IOPS。确定集群是否可以处理将来的工作负载。

Disk Latency

显示以下信息:

  • Read 显示从磁盘读取的平均时间。

  • Write 显示写入磁盘的平均时间。

监控磁盘延迟以跟踪读取和写入磁盘的效率。

Disk Queue Depth

显示发送到 MongoDB 使用的磁盘分区的请求队列的平均长度。

监控磁盘队列深度,找出潜在问题和瓶颈。

Disk Space Free

显示磁盘上剩余的可用空间总量。

监控可用磁盘空间,以确定是否使用磁盘自动伸缩还是手动增加磁盘大小。

Disk Space Percent Free

显示磁盘剩余可用空间总量占磁盘空间总量的百分比。

监控可用磁盘空间的百分比,以确定是否使用磁盘自动伸缩或手动增加磁盘大小。

Disk Space Used

显示已用磁盘总空间。

监控已用磁盘空间,以确定是否使用磁盘自动伸缩还是手动增加磁盘大小。

Disk Throughput

显示磁盘读取和写入吞吐量指标。

磁盘读取吞吐量反映从磁盘读取数据的速率,单位为兆字节/秒,表明数据库检索内存中未缓存数据的效率。

磁盘写入吞吐量衡量数据写入磁盘的速度,单位为兆字节/秒,反映数据库处理写入操作和将数据有效持久化到存储中的能力。

Document Metrics

显示以下信息:

  • Returned 显示每秒返回的文档。

  • Inserted 显示每秒插入的文档。

  • Updated 显示每秒更新的文档。

  • Deleted 显示每秒删除的文档。

监视文档指标以衡量 MongoDB 完成的工作。

Execution Time

显示以下指标的平均时长(以秒为单位):

  • Average read operational latency

  • Average write operational latency

  • Average command operational latency

监控读取操作的执行时间有无增加,以优化查询和索引。

Index Size

显示数据库中所有索引的总大小。除了索引所依据的实际文档数据之外,该指标还包括索引所产生的开销。

监控索引大小以管理索引。如要了解更多信息,请参阅索引策略

Indexes

显示数据库中的索引总数。

监控索引以对索引进行管理。如要了解更多信息,请参阅索引策略

Max Disk IOPS

显示指标颗粒度指定的时间段内的以下最大磁盘 IOPS 值:

  • max read iops 每秒最大磁盘读取输入操作数。

  • max write iops 每秒最大磁盘写入输入操作数。

监控磁盘 IOPS 是否接近预配的最大 IOPS。确定集群是否可以处理将来的工作负载。

Max Disk Queue Depth

显示指标颗粒度指定时间段内的最大磁盘队列深度值。磁盘队列深度是向 MongoDB 使用的磁盘分区发出的请求队列的平均长度。

监控磁盘队列深度,找出潜在问题和瓶颈。

Max Normalized System CPU

显示节点上所有进程的最大 CPU 使用率值,通过除以 CPU 核心数,调整范围为 0-100%。

监控 CPU 使用情况,以确定是否从磁盘而不是内存中检索数据。

如果您无法查看触发警报的使用情况,请单击相关时段并拖动鼠标,放大 Normalized System CPU 图表。通过更高分辨率的视图,您可能会发现在概述中看不到的 CPU 使用量尖峰。

Max Process CPU

显示指标颗粒度指定的时间段内的以下最大进程 CPU 值:

  • max user 显示 CPU 用于处理 MongoDB 进程的最大时间百分比。

  • max kernel 显示 CPU 为 MongoDB 进程提供操作系统调用服务所花费的最大时间百分比。

监控 CPU 使用情况,以确定是否从磁盘而不是内存中检索数据。

如果您无法查看触发警报的使用情况,请单击相关时段并拖动鼠标,放大 Normalized System CPU 图表。通过更高分辨率的视图,您可能会发现在概述中看不到的 CPU 使用量尖峰。

Max System CPU

显示节点上所有进程的 CPU 最大使用量。

监控 CPU 使用情况,以确定是否从磁盘而不是内存中检索数据。

如果您无法查看触发警报的使用情况,请单击相关时段并拖动鼠标,放大 Normalized System CPU 图表。通过更高分辨率的视图,您可能会发现在概述中看不到的 CPU 使用量尖峰。

Max System Memory

显示最大系统内存值,以字节为单位。

监视内存以确定是否升级到更高的集群层。该指标基于 free 内存值,其中 MEM USED 值包括可回收的系统内存。

Memory

显示特定时间点的内存总消耗量(以兆字节为单位):

  • memory_resident (副本集)或 memory resident(分片集群)显示节点上运行的 MongoDB 进程消耗的内存。此指标不包括其他进程的消耗,也不表示该节点消耗的总内存。

  • memory_virtual (副本集)或 memory virtual(分片集群)显示磁盘中预留的用作交换空间的内存。

监视内存以确定是否升级到更高的集群层。此指标表示指标粒度指定的时间段内的平均值。

Network

显示以下信息:

  • bytesIn 显示在所选样本周期内每秒发送至该数据库服务器的物理字节的平均速率(经过任何线路压缩后)。

  • bytesOut 显示在所选样本周期内每秒从该数据库服务器发送的物理字节的平均速率(经过任何线路压缩后)。

  • numRequests 显示在所选样本时间段内每秒发送到该数据库服务器的平均请求率。

    监控网络指标以追踪网络性能。

Normalized Process CPU

显示以下信息:

  • user 显示 CPU 为 MongoDB 进程提供服务所花费时间的百分比,除以 CPU 核心数后的范围为 0-100%。

  • kernel 显示 CPU 响应 MongoDB 进程的操作系统调用所占用时间的百分比,除以 CPU 内核数后的范围为 0-100%。

监控 CPU 使用情况,以确定是否从磁盘而不是内存中检索数据。

如果您无法查看触发警报的使用情况,请单击相关时段并拖动鼠标,放大 Normalized System CPU 图表。通过更高分辨率的视图,您可能会发现在概述中看不到的 CPU 使用量尖峰。

Normalized System CPU

显示节点上所有进程的 CPU 使用率,通过除以 CPU 核心数,调整范围为 0-100%。

监控 CPU 使用情况,以确定是否从磁盘而不是内存中检索数据。

如果您无法查看触发警报的使用情况,请单击相关时段并拖动鼠标,放大 Normalized System CPU 图表。通过更高分辨率的视图,您可能会发现在概述中看不到的 CPU 使用量尖峰。

Objects

显示数据库中的对象数量。

监控该指标以更好地了解数据库空间。

Opcounters

显示自 MongoDB 进程上次启动以来每秒运行的以下操作数量:

  • command (副本集)或 cmd (分片群集)

  • query

  • insert

  • delete

  • update

  • getmore

  • ttldeleted

ttldeleted 来自TTL索引的 删除操作仅针对处于PRIMARY 状态的节点发生,并作为标准删除复制到从节点(secondary node from replica set)节点。因此, TTL删除不适用于从节点。 Atlas维护先前主节点 (primary node in the replica set)成员的TTL删除的历史记录,并且TTL删除在先前担任主节点 (primary node in the replica set)节点的从节点上仍然可见。

监控 MongoDB 操作以验证与高工作负载相关的性能问题。确认负责负载的操作类型。

Opcounters - Repl

显示以下信息:

  • command 显示在所选采样周期内每秒应用的复制命令的平均速率。

  • insert 显示在所选样本时间段内每秒重复插入的平均速率。

  • delete 显示所选样本期内每秒应用的复制删除平均速率。

  • update 显示所选样本期内每秒应用的复制更新平均速率。

监控 MongoDB 操作以验证与高工作负载相关的性能问题。确认负责负载的操作类型。

Operation Execution Time

显示执行以下操作的平均时间,以毫秒为单位:

  • avg ms/read (副本集)或 execution time reads (分片群集)

  • avg ms/write (副本集)或 execution time writes (分片群集)

  • avg ms/command (副本集)或 execution time commands (分片群集)

监控读取操作的执行时间有无增加,以优化查询和索引。确定是否需要 升级集群层。

Oplog GB/Hour

显示主设备每小时产生的未压缩 oplog 数据的平均速率(以千兆字节为单位)。

监控 oplog 数据,确定是否必须增加 oplog 大小。

Page Faults

显示所选样本周期内该进程每秒的平均页面错误率。在非 Windows 环境中,这种情况只适用于硬页面错误。

监控页面错误,以确定是否增加内存。

Process CPU

显示以下信息:

  • user 显示 CPU 用于 MongoDB 进程的时间百分比。

  • kernel 显示 CPU 为 MongoDB 进程提供操作系统调用服务所花费的时间百分比。

监控 CPU 使用情况,以确定是否从磁盘而不是内存中检索数据。

如果您无法查看触发警报的使用情况,请单击相关时段并拖动鼠标,放大 Normalized System CPU 图表。通过更高分辨率的视图,您可能会发现在概述中看不到的 CPU 使用量尖峰。

Query Executor

显示以下信息:

  • Index Items Scanned 显示每秒扫描的索引项数。

  • Documents Scanned 显示每秒平均扫描文档数。

监控查询执行器,以确定是否存在低效查询。

Query Targeting

显示在 MongoDB 上运行的读取操作的效率:

  • Scanned Objects to Returned (副本集)或 scanned objects / returned(分片集群)显示为返回一份文档所扫描的文档数。

  • Scanned Keys to Returned (副本集)或 scanned keys / returned(分片集群)显示了为返回一份文档而扫描的索引键数量。

监控查询目标,以确定读取效率,优化查询和索引。

Atlas Search 进程 (mongot) 用来保持 Atlas Search 索引更新的变更流游标可以提高查询目标比率,如果比率很高,则会触发查询定位警报

Queues

显示以下信息:

  • GLOBAL_LOCK_CURRENT_QUEUE_TOTAL 显示排队等待任何锁定的操作数。

  • GLOBAL_LOCK_CURRENT_QUEUE_READERS 显示排队等待读锁的操作数。

  • GLOBAL_LOCK_CURRENT_QUEUE_WRITERS 显示排队等待写锁的操作数。

监视锁队列以优化查询。

Read/Write Units

显示以下信息:

  • 读取处理单元 (RPU) 总数

  • 写入处理单元 (WPU) 总数

监控读写单元,帮助优化查询和索引。

Replication Headroom

显示主节点的复制 oplog window 窗口与从节点的复制延迟之间的差异。

监视复制空间以确定从节点是否可能脱离 oplog。

Replication Lag

显示写入应用程序中从节点落后于主节点的大致秒数。

监视复制延迟以确定从节点是否可能脱离 oplog。

Replication Oplog Window

显示基于 oplog 的流失的主节点副本 oplog 中可用数据库操作的估计平均小时数。如果辅助节点上的复制延迟超过了复制 oplog 窗口,且复制空间达到零,则需要进行完全重新同步才能使该节点恢复健康状态。

监控复制 oplog 窗口和复制空间,以确定辅助节点是否很快需要完全重新同步。复制 oplog 窗口通常有助于提前确定辅助节点对计划内和计划外中断的恢复能力。

Scan and Order

显示每秒返回需要在内存中排序的结果的操作数量。

监控该指标以确定查询是否需要索引。

Shard Data Size

显示存储数据在每个分片上占用的存储空间大小(以字节为单位)。只有使用 MongoDB 6.0+ 的分片集群才能访问此图表。

监控此指标以验证分片是否均衡。

Shard Document Count

显示每个分片上的文档数量。只有使用 MongoDB 6.0+ 的分片集群才能访问此图表。

监控此指标以验证分片是否均衡。

Sort

显示spill to disk during sort ,即由$sort 个阶段引起的磁盘写入总数。

spill to disk during sort数字较高可能是由于执行集合扫描并使用 $sort阶段的资源密集型查询造成的。这些资源密集型查询会导致创建的临时文件超出可用内存,并利用磁盘空间进行排序。通过在数据库磁盘使用量增加的大约同一时间查找具有 $sort阶段的集合扫描,识别查询分析器中的违规查询。

System CPU

显示节点上所有进程的 CPU 占用率。

监控 CPU 使用情况,以确定是否从磁盘而不是内存中检索数据。

如果您无法查看触发警报的使用情况,请单击相关时段并拖动鼠标,放大 Normalized System CPU 图表。通过更高分辨率的视图,您可能会发现在概述中看不到的 CPU 使用量尖峰。

System Memory

显示以下信息:

  • used 显示使用中的物理内存字节数。

  • available 显示在不进行交换的情况下可用于运行新应用程序的系统内存字节数的估计值。

监视内存以确定是否升级到更高的集群层。此指标表示指标粒度指定的时间段内的平均值。

System Network

显示以下信息:

  • network bytes in 显示网络接口的平均接收速率(每秒的物理字节数)。

  • network bytes out 显示网络接口的平均发送速率(每秒的物理字节数)。

  • max network bytes in 显示指标粒度指定的时间段内的最大网络接收字节数值。

  • max network bytes out 显示指标粒度指定的时间段内的最大网络发送字节数值。

监控网络指标以追踪网络性能。

Tickets Available

显示以下信息:

  • Tickets Available Read 显示 WiredTiger 存储引擎可用的读取票证数量。读取票证代表存储引擎中允许的并发读取操作的数量。当该值达到零时,新的读取请求可能会排队,直到有读取票证可用。

  • Tickets Available Write 显示 WiredTiger 存储引擎可用的读取票证数量。写入票证表示允许进入存储引擎的并发写入操作数。当该值达到零时,新的写入请求可能会排队等待,直到有写入票证可用。

监控可用票证,查看读取和写入请求排队的时间。

对于在 MongoDB 7.0 及更高版本上运行的集群,请勿使用工单数量作为过载警报的指标。从 MongoDB 版本 7.0 开始,Atlas 动态调整工单数量。相反,使用排队的读取器和写入器的数量作为过载指标。

Views

显示数据库中视图的数量。

监控视图以帮助优化数据库。

后退

查看指标