/ /

/ /

修复 IOPS 问题

系统和磁盘警报条件可指示 IOPS 问题。

注意

所有硬件指标都有等效的突发报告，具有不同的可配置警报。要了解更多信息，请参阅突发报告。

您可以在项目级警报设置页面中配置以下警报条件，以触发警报。

如果每秒磁盘写入操作的平均次数超过指定阈值，则会引发 Disk read IOPS on Data Partition is（数据分区的磁盘读取 IOPS 为）警报条件。

如果每秒磁盘写入操作的平均次数超过指定阈值，则会引发Disk write IOPS on Data Partition is警报条件。

System: CPU (User) % is 测量节点上进程的 CPU 使用率，以 CPU 数量为标准。该值的范围为 0-100%。

一些常见事件可能会触发这些警报：

考虑一些可能的操作，帮助解决这些警报：

要更改集群的 IOPS，请转到 Cluster Configuration（集群配置）页面并执行以下可能的操作：

部署到 Azure 的 Atlas 集群可能会使用基于信用的突发，但磁盘只有在其信用存储桶中积累了突发信用时才会发生突发。Azure 还提供按需突发模型，只要其需求超过当前容量，磁盘就会发生突发。

请参阅 Azure 磁盘突发文档以进一步了解 Azure 磁盘突发的工作原理。

如果你经常超过已配置的 IOPS 阈值，则可以通过以下任一动作提高已配置的 IOPS 来避免消耗突发信用：

增加集群 IOPS，提高集群的 IOPS 阈值。
增加存储容量。IOPS 阈值随着存储容量的增加而增加。配置为使用至少 1 TB 存储的集群具有等于或大于最大突发性能的基线 IOPS 性能。这些数据量不会耗尽突发的信用余额。
升级集群层。更大的集群层拥有更高的 IOPS 阈值。
注意
默认情况下，部署的集群层 M140 及更大的集群层至少具有 1 TB 的存储容量。存储容量为 1 TB 或以上的集群不会耗尽突发信用余额。

观察高磁盘 I/O 的几种可行方法如下：

集群指标的 Disk IOPS 图表中的磁盘 IOPS 使用量超过了 Atlas 集群配置页面中预配的 IOPS。
Normalized System CPU指标具有较高的IOWait曲线。IOWait 测量 CPU 处于空闲状态并等待 I/O 操作完成的时间百分比。Normalized System CPU图表位于Metrics 标签页的Hardware Metrics部分下。

后退

连接

来年

存储