修复 IOPS 问题
系统和磁盘警报条件可指示 IOPS 问题。
注意
所有硬件指标都有等效的突发报告,具有不同的可配置警报。要了解更多信息,请参阅突发报告。
警报条件
您可以在项目级警报设置页面中配置以下警报条件,以触发警报。
如果每秒磁盘写入操作的平均次数超过指定阈值,则会引发 Disk read IOPS on Data Partition is
(数据分区的磁盘读取 IOPS 为)警报条件。
如果每秒磁盘写入操作的平均次数超过指定阈值,则会引发Disk write IOPS on Data Partition is
警报条件。
System: CPU (User) % is
测量节点上进程的 CPU 使用率,以 CPU 数量为标准。该值的范围为 0-100%。
常见触发器
一些常见事件可能会触发这些警报:
解决眼前的问题
考虑一些可能的操作,帮助解决这些警报:
使用 Atlas Performance Advisor 查看慢速查询和建议的索引。
查看索引策略,了解可能的进一步索引改进。
注意
您可能需要临时增加集群 IOPS 才能创建新索引。仅
M30+
层级 AWS 集群支持预配 IOPS。
要更改集群的 IOPS,请转到 Cluster Configuration(集群配置)页面并执行以下可能的操作:
云服务提供商 | 层级 | 可能的动作 |
---|---|---|
AWS |
| |
AWS |
| |
Google Cloud |
| |
AZURE |
|
实施长期解决方案
Azure 上 Atlas 集群的磁盘 IOPS 突发信用
部署到 Azure 的 Atlas 集群可能会使用基于信用的突发,但磁盘只有在其信用存储桶中积累了突发信用时才会发生突发。Azure 还提供按需突发模型,只要其需求超过当前容量,磁盘就会发生突发。
请参阅 Azure 磁盘突发文档以进一步了解 Azure 磁盘突发的工作原理。
保存突发信用
如果你经常超过已配置的 IOPS 阈值,则可以通过以下任一动作提高已配置的 IOPS 来避免消耗突发信用:
监控您的进度
观察高磁盘 I/O 的几种可行方法如下: