アラートの基本
Atlas は、クラスターを監視するのに役立つ組み込みツール、アラート、チャート、統合、ログを提供します。 Atlas は、クラスターを監視し、次の方法でパフォーマンスを向上させるのに役立つアラートを提供します。
さまざまな条件でアラートをtriggerできます。
データベース、ユーザー、アカウントなどの特定の条件に基づいてアラート設定を構成できます。
アラートを解決すると、当面の問題を修正し、長期的な解決策を実装し、進行状況を監視できます。
Atlas は、アラート設定で構成されたデータベースとサーバーの条件に対してアラートを発行します。 条件によってアラートがトリガーされると、Atlas はクラスターに警告シンボルを表示し、アラート通知を送信します。 アラート設定によって通知方法が決まります。 Atlas は、条件が解決されるか、アラートが削除または無効になるまで、定期的に通知を送信し続けます。
有用なメトリクスとアラート条件
アラートを構成するときは、アラート条件としきい値を指定します。 クラスターに関連するアラートを できる可能な アラート条件 triggerを確認します。
注意
M0
無料クラスターとM2/M5
trigger共有クラスターは、それらのクラスターがサポートするメトリクスに関連するアラートのみトリガーします。アラートとメトリクスの制限に関する完全なドキュメントについては、「 Atlas M0 (無料クラスター)、M2 、M5 M0/M2/M5
の制限を参照してください。
メトリクスを一貫して監視して、効率的なクラスターを確保します。
利用可能なチケット
これらのアラート条件は、発生する可能性のある同時読み取りまたは書込み操作の数を監視するのに役立ちます。 すべてのチケットが要求されたら、操作は待機してキューに入れなければなりません。
これらのメトリクスは、クラスター モニタリングを通じてアクセスしたTickets Availableチャートで表示できます。
Queues
これらのアラート条件は、ロックを待機している操作を測定します。
これらのメトリクスは、クラスター モニタリングを通じてアクセスしたQueuesチャートで表示できます。
詳細については、「キュー のアラート条件 」を参照してください。
CPUスティール率
バースト可能な パフォーマンスAmazon Web Services をサポートする EC2 クラスター 共有 CPU コアを使用している場合、CPU スティールが発生する可能性があります。このアラート条件は、CPU 使用率が保証されたベースライン CPU クレジット蓄積率を超過する割合を測定します。
CPU クレジットは、蓄積される CPU 使用率の単位です。クレジットは一定の割合で蓄積され、保証されたレベルのパフォーマンスを提供します。これらのクレジットは、追加の CPU パフォーマンスに使用できます。クレジット残高を使い切ると、保証されたベースラインの CPU パフォーマンスのみが提供され、超過分はスティール率として表示されます。
クラスター モニタリングを通じてアクセスしたNormalized System CPUチャートで CPU 使用率を表示できます。
詳しくは、 System: CPU (Steal) % is
アラート条件 を参照してください。
クエリ ターゲティング
インデックスを適切に構成すると、クエリのパフォーマンスが大幅に向上します。 これらのアラート条件は、非効率的なクエリを識別するのに役立ちます。 インデックスが多すぎると、書込みパフォーマンスに影響が出る可能性があります。
これらのメトリクスは、クラスター モニタリングを通じてアクセスしたQuery Targetingチャートで表示できます。
接続制限
各 Atlas インスタンスには接続制限があります。 これらのアラート条件は、スケーリングのニーズや接続の可用性に関する潜在的な問題に積極的に対処するのに役立ちます。
これらのメトリクスは、クラスター モニタリングを通じてアクセスしたConnectionsチャートで表示できます。
詳細については、「接続アラート条件 」を参照してください。
アラートの構成
アラートをtriggerする条件とユーザーへの通知方法を設定するには、 [ アラート設定 ]を構成します。 アラートは組織レベルまたはプロジェクト レベルで構成できます。 Atlas はプロジェクト レベルでデフォルトのアラートを提供します。 既存のアラートを複製し、メンテナンスウィンドウ アラートを構成できます。
具体的な要件に基づいて、アラート条件値を試す。 は最適なパフォーマンスを得るためにこれらの値を定期的に再構築します。
利用可能なチケット
これらのメトリクスが少なくとも数分間 30 を下回ると、アラートを送信するように アラート設定を構成 します。 比較的無作為の短期間のドロップによってトリガーされる誤検知を避け、これらのメトリクスが一定期間低維持な場合は問題をキャッチします。
これらのアラート条件を構成するには、「アラート設定の構成 」を参照してください。
Queues
これらのメトリクスが 1 分間に 100 を超えるとアラートを送信するように アラート設定を構成 します。 比較的無作為の短期間の急増によってトリガーされる誤検知を避けたいが、これらのメトリクスが一定期間上昇したままでは問題が発生します。
これらのアラート条件を構成するには、「アラート設定の構成 」を参照してください。
CPUスティール率
このメトリクスが 10% を超えた場合にアラートを送信するように アラート設定を構成 します。
このアラート条件を構成するには、「アラート設定の構成 」を参照してください。
クエリ ターゲティング
このメトリクスが 50 または 100 を超えるとアラートを送信するように アラート設定を構成 します。
これらのアラート条件を構成するには、「アラート設定の構成 」を参照してください。
接続制限
構成された制限の接続% が 80% または 90% を超えた場合にアラートを送信するように アラート設定を構成します 。
これらのアラート条件を構成するには、「アラート設定の構成 」を参照してください。
アラートの解決
条件によってアラートがトリガーされると、Atlas はクラスターに警告シンボルを表示し、アラート通知を送信します。 これらのアラートを解決し、将来アラート条件が発生しないように機能します。 当面の問題を修正し、長期的な解決策を実行し、進捗状況を監視する方法については、「アラートの解決 」を参照してください。
利用可能なチケット
Tickets Available アラートは、負荷により予想よりも少し時間がかかるクエリを検出するのに役立ちます。
インスタンス サイズ、またはディスク速度を増やすと、これらのメトリクスを改善できます。
Queues
キュー アラートは、負荷により予想よりも少し時間がかかるクエリを検出するのに役立ちます。
インスタンス サイズ、またはディスク速度を増やすと、これらのメトリクスを改善できます。
CPUスティール率
System: CPU (Steal) % is
アラートは、CPU 使用率が保証されたベースラインの CPU クレジット蓄積率を、指定されたしきい値より超えた場合に発生します。
詳しくは、「 CPU 使用率の問題の修正 」を参照してください。
クエリ ターゲティング
クエリ ターゲティング アラートは、多くの場合、非効率的なクエリを示します。
詳しくは、「クエリの問題の修正 」を参照してください。
接続制限
接続アラートは通常、MongoDB プロセスへの許可される接続の最大数を超えたときに発生します。 制限を超えると、オープンな接続の数が制限を下回るまで、新しい接続を開くことができなくなります。
詳しくは、「接続の問題の修正 」を参照してください。
アラート ワークフロー
アラート条件が満たされると、アラート ライフサイクルが開始されます。
詳しくは、「アラート ワークフロー 」を参照してください。