修复 CPU 使用率问题
System CPU
警报表示 MongoDB 进程的 CPU 使用率已达到指定阈值。该阈值是在创建警报时指定的。
警报条件
您可以在项目级警报设置页面中配置以下警报条件,以触发警报。
当 CPU 使用率超过指定阈值的保证基准 CPU 信用累积率时,会引发 System: CPU (Steal) % is
。有关 CPU 信用累积的更多信息,请参阅 AWS 文档中的 突发性能实例。
注意
System: CPU (Steal) % is
(系统:CPU(窃取)百分比为)警报在 EC2 实例信用余额耗尽时适用。Atlas 仅会为支持突发性能实例的 EC2 实例触发此警报。目前,这些为 M10
和 M20
集群类型。
System: CPU (User) % is
当 MongoDB 进程的 CPU 使用率(按 CPU 数量标准化)超过指定阈值时,则引发此事件。
常见触发器
未经优化的查询可能导致 System CPU
警报。此外,当前的集群层可能不支持当前的工作负载。
解决眼前的问题
考虑添加一个或多个索引以提高查询性能。
实施长期解决方案
请考虑将集群升级到更高层级,以降低当前工作负载占用的 CPU 使用率。有关升级集群的更多信息,请参阅修改集群。
监控您的进度
查看Normalized System CPU 图表,用于监控节点上所有进程的 CPU 使用率,通过除以 CPU 核心数,调整范围为 0%-100%。
监控 CPU 使用情况,以确定是否从磁盘而不是内存中检索数据。
如果您无法查看触发警报的使用情况,请单击相关时段并拖动鼠标,放大 Normalized System CPU 图表。通过更高分辨率的视图,您可能会发现在概述中看不到的 CPU 使用量尖峰。
要了解更多信息,请参阅查看集群指标。