Docs Menu
Docs Home
/
MongoDB Ops Manager
/ /

アラート条件の確認

項目一覧

  • ホスト アラート
  • レプリカセット アラート
  • シャーディングされたクラスター アラート
  • エージェント アラート
  • バックアップ アラート
  • BI Connector アラート
  • ユーザー アラート
  • プロジェクト アラート

作成するプロジェクトまたはグローバルアラートごとに、ターゲットと条件またはメトリクスを設定する必要があります。 ターゲットは、変更されたもの( MongoDB Ops Managerコンポーネント)を指します。 条件が true になるか、メトリクスが設定したしきい値を満たすと、 MongoDB Ops Managerはアラートをトリガーします。 詳しくは、「アラート ワークフロー 」を参照してください。

条件を設定するには、次の手順に従います。

  1. リストから Targetを選択します。

  2. condition/metricリストで条件を選択します。

MongoDB Ops Manager は、指定されたターゲット MongoDB インスタンスで条件が trueの場合にアラートをトリガーします。

メトリクスを設定するには、次の手順に従います。

  1. リストからTargetタイプを選択します。

  2. Target型をフィルタリングするか、 Anyを選択します。

  3. condition/metricリスト内のメトリクスで [] を選択します。

  4. このメトリクスをBelowまたはAboveにする場合は を選択します。

  5. しきい値を入力します。 すべてのしきい値は数値です。

  6. しきい値の測定単位を選択します。

MongoDB Ops Manager は、指定されたターゲット MongoDB インスタンスでメトリクスしきい値が満たされたときにアラートをトリガーします。

ホストのアラートを設定するときは、このアラートに適用するhost typeと、このアラートをトリガーするconditionを選択します。

host typeの場合、MongoDB プロセスのすべてまたは次のタイプのアラートを設定します。

ホストタイプを に設定します。
アラートには次が含まれます:
任意のタイプ
この表で説明されているすべてのタイプ。
スタンドアロン
レプリカセットまたはシャーディングされたクラスターの一部では なく 、コンフィギュレーションサーバーとして使用されてい ない 任意の mongod インスタンス。
原発
すべてのレプリカセットプライマリ。
セカンダリ
すべてのレプリカセットセカンダリ。
アービタ
すべてのレプリカセットアービタ。
mongos
すべてのmongosインスタンス。
Config
コンフィギュレーション サーバー として使用されるすべての mongod インスタンス。

MongoDB インスタンスが変更されたときの アラートを設定できます 。 ホストのステータス条件には、次のものが含まれます。

条件
アラートtrigger
ホストが追加されました
MongoDB Ops Managerは、初めてmongodまたはmongosプロセスのモニタリングまたは管理を開始します。
ホストが削除されました
MongoDB Ops Managerは、 mongodまたはmongosプロセスの監視または管理を初めて停止します。
レプリカセットに追加されたホスト
指定されたタイプのmongodプロセスはレプリカセットに追加されます。
レプリカセットから削除されたホスト
指定されたタイプのmongodプロセスはレプリカセットから削除されます。
ホストが再起動しました
MongoDB Ops Managerは、ホストが再起動されたことを検出します。
過去 1 時間の再起動は
MongoDB Ops Managerは、過去 1 時間以内にホストが再起動したホストが指定されたしきい値を超えていることを検出します。
ホストがロールバックを発生しました

MongoDB Ops Managerは、ホスト上のmongodがロールバックをトリガーしたことを検出します。

次のホストタイプではロールバックは発生しません。

詳細については、「レプリカセットフェイルオーバー中のロールバック 」を参照してください。

ホストはリカバリしています
ホストのバージョンが最新でない

ホスト上で実行されている MongoDB の改訂版は、MongoDB の現在の安定版リリースより 2 つ以上遅れています。

たとえば、現在の安定リリースがMongoDB 4.0.9 の場合、 MongoDB 4.0.8 を実行しているホストではアラートはtriggerされませんが、 MongoDBバージョン 4.0.7 を実行しているホストではアラートがtriggerされます。

MongoDB のバージョン番号付けの詳細については、MongoDB マニュアルの「 MongoDB のバージョン番号」を参照してください。

ホストの SSL 証明書は 30 日以内に期限切れになります
MongoDB インスタンスの SSL 証明書の有効期限は 30 日から 30 日後です。 MongoDB Ops Manager は、解決または確認されるまで、24 時間ごとにアラートを再送信します。 アラートを解決または確認せず、証明書の有効期限が切れた場合、MongoDB Ops Manager は引き続きアラートを送信します。 証明書の有効期限が切れると、モニタリングは MongoDB インスタンスに接続できなくなります。
ホストがダウンしている

MongoDB Ops Manager は 4 分以上ホストから ping を受信しません。 通常の操作では、モニタリングは各モニター対象ホストに約 1 分ごとに 1 回接続します。 MongoDB Ops Managerは、ホストの再起動中に発生するような誤検知を最小限に抑えるために、 アラートをトリガーする前に 4 分間待機します。

ホストに引き続きアクセスできない場合、モニタリングによって ping 頻度は最終的に、 mongodでは5分ごと、 mongos では20分ごとに削減されます。 mongodまたはmongosが再びアクセス可能になった場合、 MongoDB Ops Managerは 5 分以内にプロセスを認識します。

MongoDB Ops Manager Automation がmongosプロセスを管理せず、そのプロセスが 30 日間アクセスできない状態の場合、 MongoDB Ops Managerは Deployment タブからそのプロセスを削除します。 ただし、 mongosプロセスを再起動すると、 MongoDB Ops Managerはそれを検出します。

このアラートを解決するには、「ホストの修正 」を参照してください。

Performance Advisorにホストのインデックスの提案がある場合は、 Host Has Index Suggestionsアラートを設定してアラートを受信できます。

ホストのクエリ ターゲティング比率が 10 分間、一貫して 10,000 を超える場合、Performance Advisor はホストをチェックし、非効率的なクエリとパフォーマンスを向上させる可能性のあるインデックスをチェックします。 Performance Advisor が 1 つ以上のインデックスがホストにメリットをもたらすと判断した場合、このアラートがトリガーされ、推奨されるインデックスを作成するように指示されます。

このアラートは、trigger が無効になっているプロジェクトではPerformance Advisor しません。

インスタンスが 1 秒あたりに作成したアサーション エラーの数に関するアラートを設定できます。

注意

測定方法

MongoDB は、 serverStatusコマンドが返すassertsドキュメントを使用して、opscounter をレポートします。

アサート メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
アサート。通常は
通常のアサートのレートが指定したしきい値を満たしています。
アサート。警告は
警告のレートが指定したしきい値を満たしています。
アサート。Mg は
メッセージ アサートのレートが指定したしきい値を満たしています。 メッセージ アサートは内部サーバー エラーです。 スタック トレースはログに記録されます。
アサート: ユーザーは
ユーザーが作成するアサートのレートが指定したしきい値を満たしています。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

重要

MongoDB 3.4 以降にのみ適用

次のメトリクスは、MongoDB バージョン 3.4 以降を実行している配置にのみ適用されます。

操作の完了までの所要時間のアラートを設定できます。 実行時間メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
平均実行時間。コマンドは
コマンド操作の平均実行時間が指定したしきい値を満たしています。
平均実行時間。読み取りは
読み取り操作の平均実行時間が指定したしきい値を満たしています。
平均実行時間。書込みは
書込み (write) 操作の平均実行時間が指定したしきい値を満たしています。

1 秒あたりに処理される MongoDB ドキュメントの数のアラートを設定できます。 ドキュメント処理メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
ドキュメント メトリクス。削除は
削除されたドキュメントの 1 秒あたりの平均レートが、指定したしきい値を満たしています。
ドキュメント メトリクス。挿入は
挿入されたドキュメントの 1 秒あたりの平均レートが指定したしきい値を満たしています。
ドキュメント メトリクス。返されるのは
返されたドキュメントの 1 秒あたりの平均レートが、指定したしきい値を満たしています。
ドキュメント メトリクス。更新は
更新されたドキュメントの 1 秒あたりの平均レートが、指定したしきい値を満たしています。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

クエリ中に MongoDB がアイテムをスキャンする速度や、返されたドキュメントと比較してスキャンされたアイテムの数に関するアラートを設定できます。 クエリ実行時間メトリクスには、次のものが含まれます。

注意

測定方法

MongoDB は、 explainコマンドに基づいてクエリのパフォーマンスを測定します。

Query Targeting: Scanned is

クエリおよびクエリプランの評価中にインデックス項目をスキャンするための 1 秒あたりの平均レートが、指定されたしきい値を満たしています。

Query Targeting: Scanned Objects is

ドキュメントをスキャンする 1 秒あたりの平均レートが指定したしきい値を満たしています。

Query Targeting: Scanned / Returned is

返されたドキュメントに対するスキャンされたインデックス項目の割合が、指定されたしきい値を満たしています。

Query Targeting: Scanned Objects / Returned is

スキャンされたドキュメントと返されたドキュメントの比率が指定されたしきい値を満たす。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

1 秒あたりに完了するデータベース操作の数のアラートを設定できます。

注意

測定方法

MongoDB は、 serverStatusコマンドが返すopscountersドキュメントを使用して、opscounter をレポートします。

操作メトリクスには、次のものが含まれます。

条件
アラートtrigger
Opcounter。Cmd は
1 秒あたりに実行されるコマンドの平均レートが、指定したしきい値を満たしています。
Opcounter: 削除は
1 秒あたりに実行される削除の平均レートが、指定したしきい値を満たしています。
Opcounter: Get mores は
1 秒あたりに実行される getMores の平均レートが、指定したしきい値を満たしています。 プライマリでは、クエリ数が少ない場合でも、この数は高くなることがあります。 セカンダリは、レプリケーションの一部としてプライマリから "getMore" を実行します。
opcounter。挿入は
1 秒あたりに実行される挿入の平均レートが、指定したしきい値を満たしています。
Opcounter。クエリは
1 秒あたりに実行されるクエリの平均レートが、指定したしきい値を満たしています。
Opcounter。更新は
1 秒あたりに実行された更新の平均レートが、指定したしきい値を満たしています。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

MongoDBセカンダリに複製される 1 秒あたりのデータベース操作の数のアラートを設定できます。

注意

測定方法

MongoDB は、 serverStatusコマンドが返すopscountersReplドキュメントを使用して、opscounter をレポートします。

レプリケーション操作メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
Opcounter。Repl Cmd は
1 秒あたりに適用される複製済みコマンドの平均レートは、しきい値を満たしています。
Opcounter: Repl Delete は
1 秒あたりに適用される複製済み削除の平均レートが しきい値を満たしています。
Opcounter。Repl Insert は
1 秒あたりに適用される複製済み挿入の平均レートが しきい値を満たしています。
Opcounter。Repl 更新は
1 秒あたりに適用される複製済み更新の平均レートが しきい値を満たしています。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

MongoDB インスタンスが使用するメモリ量のアラートを設定できます。 このしきい値は、ビット、キロビット、メガビット、ギガビット、バイト、キロバイト、メガバイト、ギガバイト、テラバイト、またはペタバイト単位で設定します。

注意

測定方法

MongoDB は、 serverStatusコマンドが返すmemドキュメントを使用してメモリに関するレポートを作成します。

メモリ メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
メモリ。常駐は
mongodプロセスの常駐メモリ サイズが指定されたしきい値を満たしています。 専用データベース ホストでは時間の経過とともに、常駐メモリがホスト上の RAM の量に近づく可能性があります。
メモリ。仮想は
mongodプロセスの仮想メモリのサイズが指定したしきい値を満たしています。 このアラートを使用すると、メモリ マッピング外の過剰なメモリにフラグを付けることができます。
メモリ。マップ済みは
mongodプロセスのマッピングされたメモリ サイズが指定されたしきい値を満たしています。 MongoDB メモリがすべてのデータファイルをマッピングするため、マップされたメモリのサイズはデータベースの合計サイズに近づく必要があります。
メモリ。計算は
メモリ マッピングで考慮されていないmongodプロセスの仮想メモリ サイズが指定されたしきい値を満たしています。 この数字が非常に高い場合(数ギガバイト)、メモリ マッピング以外で過剰なメモリが使用されていることを示します。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

セキュリティ メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
ホストにはセキュリティの推奨事項があります
認証または TLSは無効になっています。

スワップ メトリクスには、以下が含まれます。

メトリクス
アラートtrigger
スワップ使用量。使用されるのは
使用中のスワップ領域の合計量が指定されたしきい値に達しました。
スワップ使用量。最大使用量は
使用中のスワップ領域の最大合計量が指定されたしきい値に達しました。
スワップ使用量。無料は
使用可能なスワップ領域の量が指定されたしきい値を下回りました。
スワップ使用量。最大無料は
使用可能なスワップ領域の最大量が指定されたしきい値を下回る。

MongoDB インスタンスが使用する WiredTiger キャッシュの量のアラートを設定できます。 このしきい値は、ビット、キロビット、メガビット、ギガビット、バイト、キロバイト、メガバイト、ギガバイト、テラバイト、またはペタバイト単位で設定します。

注意

測定方法

MongoDB は、 serverStatusコマンドが返すcacheドキュメントを使用してメモリに関するレポートを作成します。

WiredTiger キャッシュ メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
キャッシュ: キャッシュに読み込まれるバイトは
WiredTiger のキャッシュに読み込まれる 1 秒あたりのバイト数の平均レートが、指定したしきい値を満たしています。
キャッシュ: キャッシュから書き込まれたバイト数は
WiredTiger のキャッシュから書き込まれる 1 秒あたりのバイト数の平均レートが、指定したしきい値を満たしています。
キャッシュ。ダーティバイトは
WiredTiger キャッシュに現在存在する追跡ダーティーバイトの数。
キャッシュ。使用済みバイトは
WiredTiger キャッシュに現在含まれているバイト数。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

重要

MongoDB 2.2 から 2.6 にのみ適用されます

これらのメトリクスは、MongoDB バージョン 2.2 から 2.6 を実行している配置でのみアラートをトリガーします。

MongoDB インスタンスで 1 秒あたりに完了する b木操作の数に関するアラートを設定できます。 B木メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
B木。アクセスは
B 木インデックスへのアクセス数が指定したしきい値を満たしています。
B木。ヒットは
B 木ページがメモリ内に存在した回数が指定されたしきい値を満たしています。
B木。欠落は
B ツリー ページがメモリに存在しなかった回数が指定されたしきい値を満たしていません。
B木。欠落率は
エラーとヒットの比率が指定したしきい値を満たしています。

重要

MongoDB 2.2 から 2.6 にのみ適用されます

このメトリクスは、MongoDB バージョン 2.2 から 2.6 を実行している配置でのみアラートをトリガーします。

MongoDB インスタンスが書込みロック(write lock) されている時間の割合のアラートを設定できます。 有効ロック%のメトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
有効ロック%は
インスタンスが書込みロックされている合計時間の割合が指定したしきい値を満たす場合。

重要

MMAPv1 を実行しているデータベースのみに適用されます

このメトリクスは、MongoDB データベースの MMAPv1 ストレージ エンジンを実行している配置でのみアラートをトリガーします。

MongoDB インスタンスの平均フラッシュが完了するまでにかかる時間(ミリ秒単位)のアラートを設定できます。 フラッシュとは、メモリからディスクへのデータの書き込みです。

注意

測定方法

MongoDB は、 serverStatusコマンドが返すbackgroundFlushing.average_ms値を使用して、平均バックグラウンド フラッシュ時間をレポートします。

バックグラウンド フラッシュの平均メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
バックグラウンド フラッシュの平均は
バックグラウンド フラッシュの平均時間が指定したしきい値を満たしています。

MongoDB インスタンスへのアクティブな接続のアラートを設定できます。

注意

測定方法

MongoDB は、 serverStatusコマンドが返すconnectionsドキュメントを使用してメモリに関するレポートを作成します。

接続メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
接続は
アクティブなホスト接続の数が指定したしきい値を満たしています。
設定された制限の接続割合は

可能なホスト接続の合計数に対するアクティブなホスト接続の割合が、指定したしきい値を満たしています。 MongoDB バージョン 2.6.0 と 3.0.0 のデフォルト値は65536で、MongoDB バージョン( > ) 3.0.0 より大きい MongoDB バージョンのデフォルト値は1000000です。 デフォルト値は、次の 2 つの方法で上書きできます。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

ロックを待機している操作に対して アラートを設定 できます。

注意

測定方法

MongoDB は、 serverStatusコマンドが返すglobalLock.currentQueueドキュメントを使用してメモリに関するレポートを作成します。

キュー メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
クエリ。合計は
任意のタイプのロックを待機している操作の数が、指定したしきい値を満たしています。
キューです。読み取りは
任意のタイプのロックを待機している読み取り操作の数が指定したしきい値を満たしています。
キューです。ライターは
任意のタイプのロックを待機している書込み (write) 操作の数が、指定したしきい値を満たしています。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

重要

MongoDB 2.2 から 2.6 にのみ適用されます

Accesses Not In Memory: Total isPage Fault Exceptions Thrown: Total isメトリクスとtrigger メトリクスは、MongoDB バージョン 2.2 から 2.6 を実行している配置でのみアラートを します。

ページフォールトのアラートを設定できます。

注意

測定方法

MongoDB は、 serverStatusコマンドが返すextra_info.page_faultsドキュメントを使用してメモリに関するレポートを作成します。

MongoDB 2.2から2.6は、 serverStatusコマンドが返したrecordStatsドキュメントを使用して、 Accesses Not In Memory: Total isPage Fault Exceptions Thrown: Total isのメトリクスを報告しました。

ページフォールト メトリクスには、以下が含まれます。

メトリクス
アラートtrigger
メモリ外のアクセス。合計は
ディスク アクセスのレートが指定したしきい値を満たしています。 ワーキングセットがメモリに収まらない場合、MongoDB はディスク上のデータにアクセスする必要があります。 このメトリクスは、ホストのRecord Statsチャートで確認できます。
ページフォルト例外発生数。合計は
スローされたページフォールト例外のレートが指定されたしきい値を満たしています。 このメトリクスは、ホストのRecord Statsチャートで確認できます。
ページフォールトは
ページフォールトのレート(例外が発生するかどうかにかかわらず)が指定されたしきい値を満たしています。 このメトリクスは、ホストのPage Faultsチャートで確認できます。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

MongoDB プロセスでは、オープンカーソルとタイムアウトしたカーソルの数のアラートを設定できます。

注意

測定方法

MongoDB は、 serverStatusコマンドが返すmetrics.cursorドキュメントを使用してメモリに関するレポートを作成します。

カーソル メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
カーソル。クライアント カーソルのサイズは
ホストがカーソルを維持するために使用するメモリの量が指定されたしきい値を満たしています。
カーソル。オープンは
ホストがクライアント用に保持しているカーソルの数が、指定されたしきい値を満たしています。
カーソル。タイムアウトは
ホストがクライアント用に保持しているタイムアウトしたカーソルの数が、指定したしきい値を満たしています。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

MongoDB プロセスのネットワーク スループットのアラートを設定できます。

注意

測定方法

MongoDB は、 serverStatusコマンドが返すnetworkドキュメントを使用してメモリに関するレポートを作成します。

ネットワーク メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
ネットワーク。バイト入力は
データベース ホストに 送信されるバイト数が指定したしきい値を満たしています。
ネットワーク。バイト出力は
データベース ホストから送信されるバイト数が指定したしきい値を満たしています。
ネットワーク。リクエスト数は

データベース ホストに送信されたリクエストの数が指定したしきい値を満たしています。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

MongoDB プロセスのレプリケーション oplog のアラートを設定できます。

注意

測定方法

MongoDBoplogは、oplog serverStatus コマンドが返す ドキュメントと rs.status() と rs.conf()の結果を組み合わせて、レプリケーション をレポートします 。

レプリケーション oplog メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
レプリケーション ヘッドルームは
同期ソースのレプリケーションoplog window とセカンダリのレプリケーションラグの差が、指定したしきい値を満たしています。 この値が 0 になる場合、セカンダリは RECOVERING にGoことができます。
レプリカ時間は
プライマリのレプリケーションoplogで使用可能なおおよその時間量(ミリ秒単位)が指定されたしきい値を満たしています。
1 時間あたりの oplog データは
プライマリが 1 時間あたりに生成する oplog の平均レート(ギガバイト)が指定されたしきい値を満たしています。
レプリケーションラグは
書き込みアプリケーションにおいてセカンダリプライマリより遅れているおおよその秒数。 この統計の精度が制限されているため、遅延が1 - 2秒より大きい場合にのみ正確です。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

MongoDB プロセスのスキャン操作と順序操作に対してアラートを設定できます。

注意

測定方法

MongoDB は、serverStatus コマンドが返す metrics.operation.scanAndOrder ドキュメントを使用して、レプリケーション Oplog をレポートします。

操作メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
操作: スキャンと順序は
インデックスを使用してソート操作を実行できない、ソートされた結果を返す、指定したしきい値を超えるクエリの 1 秒あたりの平均レート。

データ ストレージの使用量のアラートを設定できます。 データベース ストレージ メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
DB ストレージは
エクステントによって使用されるディスク上のストレージ容量が指定したしきい値を満たしています。
DB データのサイズは
データベース内の実際のデータ サイズが指定したしきい値を満たしています。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

使用されているジャーナリング ストレージの量のアラートを設定できます。 ジャーナリング メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
書込みロック (write lock) でのコミットのジャーナリングは
データベースが書込みロック(write lock) を行っている間に発生したコミットのレートが、指定したしきい値を満たしています。
ジャーナリング MB は
Ops Manager が 1 秒あたりにリカバリ ログに書き込むデータの平均量(メガバイト単位)が、指定されたしきい値を満たしています。
ジャーナリング書込み (write) データファイル MB は
MongoDB Ops Managerが 1 秒あたりにデータベース データファイルに書込むデータの平均レート(メガバイト単位)が、指定したしきい値を満たしています。 これらの書込みはすでにジャーナリングされているため、遅延が発生する可能性があり、ここで示される数値はディスクに物理的に書込まれる量よりも少なくなる可能性があります。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

WiredTiger チケットにアラートを設定できます。

注意

測定方法

MongoDB は、wiredTiger.cache wiredTiger.concurrentTransactionsserverStatus コマンドが返す ドキュメントと ドキュメントを使用して、WiredTiger に関するレポートを作成します。

WiredTiger のストレージ エンジンの条件には、次のものが含まれます。

メトリクス
アラートtrigger
利用可能なチケット。読み取りは
WiredTiger ストレージ エンジンで利用可能な読み取りチケットの数が指定されたしきい値を満たしています。
利用可能なチケット。書き込みは
WiredTiger ストレージ エンジンで使用可能な書込み (write) チケットの数が指定したしきい値を満たしています。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

コンピュートとディスク使用率のアラートを設定できます。 システム リソースの条件には、次のものが含まれます。

メトリクス
アラートtrigger
システム: CPU(スティール)% は

EC2 インスタンスのクレジット残高をすべて使い切った場合に適用されます。

CPU が「強制待機」状態になっている時間の割合。 CPU スティール率とは、CPU 使用率が保証されたベースライン CPU クレジット蓄積率を超過する割合です。

このアラートは通常、Amazon Web Services のバースト可能なパフォーマンスインスタンスですべてのクレジットが消費されたときにトリガーされます。

システム: Max CPU(スティール)% は
CPU が「任意待機」状態にある時間の最大パーセンテージが、指定されたしきい値を超えています。
システム: CPU(ユーザー)% は
MongoDB プロセスの CPU 使用率。CPU 数で割った 0~100% の範囲でスケーリングされます。
システム: Max CPU(ユーザー)% は
CPU 数で割った 0~100% の範囲でスケーリングされた MongoDB プロセスの最大 CPU 使用率が、指定されたしきい値を超えています。
システム メモリ。使用は
mongodに使用される合計システムメモリからバッファ、キャッシュ、空きメモリを差し引いた値が指定されたしきい値を満たす。
システム メモリ。最大使用量は
システム メモリ使用量の最大値が指定されたしきい値を満たしています。
システム メモリ。使用可能なは
mongodで利用可能なシステムメモリ使用量が指定されたしきい値を下回りました。
システム メモリ。使用可能な最大値は
使用可能なシステム メモリの最大量は、指定されたしきい値を下回ります。
データパーティションで使用されているディスク領域の % は
MongoDB コレクションのデータを含むパーティションで使用されているディスクスペースの割合。
データパーティションで使用される最大ディスク領域 % は
MongoDB コレクションのデータを含むパーティションで使用されるディスクスペースの最大割合が、指定したしきい値を超えています。
インデックス パーティションで使用されるディスク領域の % は
MongoDB インデックス データを含むパーティションで使用されているディスクスペースの割合。
インデックス パーティションで使用される最大ディスク領域 % は
MongoDB インデックス データを含むパーティションで使用されるディスクスペースの最大割合は、指定したしきい値を超えます。
ジャーナル パーティションで使用されるディスク領域の % は
ジャーナリング が有効になっている場合に、MongoDB ジャーナルを含むパーティションで使用されているディスク領域の割合。
ジャーナル パーティションで使用される最大ディスク領域 % は
MongoDB ジャーナルを含むパーティションで使用されるディスクスペースの最大割合が、指定したしきい値を超えています。
System Network In は
データベース ホストに 送信される1 秒あたりのバイト数が、指定されたしきい値を満たしています。
Max System Network In は
MongoDB に 送信される最大バイト数が指定したしきい値を満たしています。
システム ネットワーク出力は
データベース ホストから送信される 1 秒あたりのバイト数が、指定したしきい値を満たしています。
Max システム ネットワーク出力は
MongoDBから送信される最大バイト数が指定したしきい値を満たしています。

注意

MongoDB Ops Managerでは、これらのメトリクスの選択に対するチャートを作成できます。

  1. MongoDB Ops Managerプロジェクトの Deployment ビューから、List タブをクリックします。

  2. 監視するプロセスをクリックします。

  3. [Status] タブをクリックします。

  4. [] を下にスクロールして使用可能なメトリクスのリストを表示し、チャート化するメトリクスを選択します。

MongoDB Ops Managerでホストメトリクスのチャートを作成する方法について詳しくは、 「 配置メトリクスの表示 」を参照し、MongoDB Process Metrics タブをクリックします。

レプリカセット 内の プライマリ のステータスと正常なノードの数に関するアラートを設定できます。レプリカセットの条件には、次のものが含まれます。

条件
アラートtrigger
レプリカセットが新しいプライマリを選択しました

セットによって新しいプライマリが選択されます。 MongoDB Ops Managerは ping を受信するたびに、レプリカセットのrs.status()メソッドの出力を検査し、各レプリカセット ノードのステータスを検査します。 MongoDB Ops Managerはこの出力から、どのレプリカセット メンバーがプライマリであるかを決定します。 ping データで見つかったプライマリが、 MongoDB Ops Managerに認識されている現在のプライマリと異なる場合、このアラートがトリガーされます。

このアラートを受け取った場合は、セットが新しいプライマリを選択したことを必ずしも意味するわけではありません。 このアラートは、同じプライマリが再選出されたときにtriggerされる可能性もあります。 これは、MongoDB Ops Manager が選挙の途中で ping を処理する場合に発生する可能性があります。

レプリカセットにはプライマリがない

レプリカセットにはプライマリはありません。 具体的には、レプリカセットのどのノードもステータスがPRIMARYでない場合、アラートがトリガーされます。 たとえばこの条件は、セットに偶数の投票ノードがあり、同数になった場合に発生する可能性があります。

モニタリングが プライマリ の選挙中にデータを収集する場合、このアラートは誤検知を送信する可能性があります。 このような誤検知を防ぐには、アラート構成のafter waiting間隔(構成のSend toセクション)を設定します。

解決については、「失われたプライマリの修正 」を参照してください。

レプリカセット メトリクスには、次のものが含まれます。

メトリクス
アラートtrigger
正常なノードの数は
レプリカセットの正常なノードは、指定したしきい値よりも数が少ないです。
正常でないノードの数は
レプリカセットに正常でないノードがあり、指定したしきい値を超えています。
過去 1 時間の選挙数は > X
過去 1 時間に発生した選挙の数が、ユーザー指定の値であるXを超えました。 Xの値は、アラートを作成するときに設定されます。 絶えず続く選挙からも明らかですが、このアラートは、クラスターのレプリケーションが正常な状態ではないことを示している可能性があります。

注意

レプリカセット ノードは、そのレプリカセットに対してrs.status()を実行し、その結果そのノードに対してPRIMARYまたはSECONDARYが返される場合、そのレプリカセット ノードは正常です。 非表示のセカンダリとアービタはカウントされません。

シャーディングされたクラスターから欠落しているmongosのアラートを設定できます。 シャーディングされたクラスターの条件には、次のものが含まれます。

条件
アラートtrigger
クラスターにはアクティブな mongos がありません
MongoDB Ops Manager はクラスターのどのmongosにも到達できません。

エージェントのステータスやバージョン管理に関するアラートを設定できます。 エージェントの条件には、次のものが含まれます。

条件
アラートtrigger
オートメーションはダウンします

少なくとも 1 分間、オートメーションが検出されません。 通常の操作では、オートメーションはMongoDB Ops Managerに約 10 秒ごとに ping を送信します。 MongoDB Ops Managerが少なくとも 1 分間 ping を受信しない場合、このアラートがトリガーされます。

このアラートは、オートメーションが MongoDB プロセスまたはエージェント モジュールを管理している場合にのみトリガーされます。

モニタリングがダウンしています

少なくとも 7 分間、モニタリングが検出されません。 通常の操作では、モニタリングはMongoDB Ops Managerに 1 分ごとに約 1 回 ping を送信します。 MongoDB Ops Managerが少なくとも 7 分間、ping を受信しない場合、このアラートがトリガーされます。 ただし、ホストが設定されていないプロジェクトでは、このアラートはトリガーされません。

重要:モニタリングがダウンすると、 MongoDB Ops Managerはどのホストに対しても他のアラートをトリガーしません。 例: ホストがダウンした場合、新しいアラートをMongoDB Ops Manager triggerできる可能性のある にデータを送信するためのモニタリングはありません。

モニタリングは最新バージョンではありません
モニタリングでは最新バージョンのソフトウェアは実行されていません。
バックアップがダウンしています

少なくとも 1 つのアクティブなレプリカセットまたはクラスターを持つプロジェクトのバックアップが 1 時間以上ダウンしている。

このアラートを解決するには、以下の手順を行います。

  1. どのホストがバックアップを提供しているかを確認するには、 Deploymentをクリックし、次にServersタブをクリックします。

  2. そのホスト上のバックアップ ログファイルを確認します。

バックアップのバージョンが最新でない
バックアップでは最新バージョンのソフトウェアは実行されていません。
バックアップでテレカンの失敗が多すぎる

モニタリングで既知のクラスター トポロジーは、バックアップが作成する confからのバックアップ構成と一致しません。

試行回数がmaximumFailedConfCalls設定で指定したしきい値に達しました。

このアラートはグローバルアラートとしてのみ使用できます。

バックアップ oplog、再同期、不整合に関するアラートを設定できます。 バックアップ条件には、次のものが含まれます。

条件
アラートtrigger
バックアップ oplog が遅れています

が受信した直近のoplog データは、MongoDB Ops Manager 75分以上経過しています。

このアラートを解決するには、「バックアップoplog問題の修正 」を参照してください。

バックアップには再同期が必要です

バックアップのレプリケーション プロセスがoplogより大幅に遅れ、追いつくことができません。 これは、バックアップがまだレプリケーションされていない oplog エントリをホストが上書きするときに発生します。 このような状況が発生した場合は、「 バックアップの再同期 」の手順で説明されているように、バックアップを再同期する必要があります

また、対応するバックアップ ログも確認してください。 「Failed Common Points」テストが表示される場合、次のいずれかの結果が発生している可能性があります。

  • バックアップされたレプリカセットで重要なロールバック イベントが発生しました。

  • バックアップされたレプリカセットのoplogがサイズ変更または削除されました。

  • oplog のチャーンが高いため、エージェントは oplog の末尾を失う可能性がありました。

一貫性のないバックアップ構成が検出されました

MongoDB Ops Managerは、バックアップの構成がバックアップするMongoDB配置の構成と一致しないことを検出しました。

このアラートを解決するには、「一貫性のないバックアップの修正 」を参照してください。

一貫性のないクラスター スナップショット数は...

MongoDB Ops Managerがクラスター スナップショットを正常に取得するには、 回連続で失敗します。 このアラートは、試行回数が指定したしきい値を満たしたときにトリガーされます。

アラート テキストには、問題の理由が含まれている場合があります。 一般的な問題には、次のようなものがあります。

  • 到達可能なmongosはありませんでした。 この問題を解決するには、 ページに少なくとも 1mongos つのMongoDB Ops ManagerDeployment が表示されていることを確認します。

  • バランサーを停止できませんでした。 この問題を解決するには、最初のコンフィギュレーションサーバーのログファイルを確認して、バランサーが停止しない理由を判断します。

  • 1 つ以上のシャードにトークンを挿入できませんでした。 この問題を解決するには、バックアップとすべてのシャード間の接続を確保します。

バックアップをバックアップデーモンに割り当てることができませんでした

バックアップジョブをバックアップデーモンにバインドするのに失敗します。

例、ジョブがバインドに失敗する理由には次のものが含まれますが、これらに限定されません。

  • バックアップされたレプリカセットのプライマリが見つかりません。 バインディングが発生した時点で、モニタリングはプライマリを検出しませんでした。 レプリカセットが正常であることを確認します。

  • どのバックアップデーモンでも十分なスペースがありません。

    どちらの場合も、問題を解決してバックアップの最初の同期を再開してください。

    あるいは、 Adminインターフェースを介して、ジョブをデーモンに手動でバインドすることもできます。 詳細については、「ジョブ」を参照してください。

このアラートはグローバルアラートとしてのみ使用できます。

バックアップが大量の再試行回数に達しました

同じタスクが繰り返し失敗する場合はアラートを送信します。 これは、メンテナンス中に発生する可能性があります。 問題を説明するエラーメッセージについては、対応するジョブログで確認してください

エラー メッセージの解釈でサポートが必要な場合は、 MongoDB サポート にお問い合わせください。

このアラートはグローバルアラートとしてのみ使用できます。

バックアップが予期しない状態です

予期しない状況が発生し、レプリカセットのバックアップ状態はbrokenになりました。 「 バックアップの再同期手順 」で説明されているように、バックアップされたレプリカセットを再同期する必要があります。

Backup is in an unexpected stateアラートの場合は、対応するジョブログで、問題を説明するエラー メッセージを確認してください。 エラー メッセージの解釈でサポートが必要な場合は、 MongoDB サポート にお問い合わせください。

このアラートはグローバルアラートとしてのみ使用できます。

レプリカセットのスナップショットが遅くなっています

次のスナップショットが開始される前に、スナップショットが完了しませんでした。 Admin インターフェース のジョブ ログでエラーを確認します 。MongoDB Ops Manager

このアラートはグローバルアラートとしてのみ使用できます。

同期スライスの転送はここでは進行していません。

最初の同期が開始されましたが、その後停止しました。 これを引き起こす可能性のある問題には、以下が含まれますが、これらに限定されません。

  • ダウンしているプロセス(エージェント、取り込み、バッキング データベース)

  • ネットワークの問題

  • 誤った認証情報

このアラートはグローバルアラートとしてのみ使用できます。

バックアップジョブは ..

1 つのバックアップジョブが 24 時間以内に指定したしきい値を超えて動作している時間数。

さまざまなバックアップジョブはバックアップデーモンまたはスナップショット保存を共有します。 バックアップジョブの実行時間はさまざまです。 バックアップ ジョブの実行が長時間になると、残りのジョブが遅れたり失敗したりする恐れがあります。 このメトリクスを、配置内でバックアップが完了するまでにかかると予想される時間に設定します。

エラー メッセージについては、対応するジョブ ログを確認してください。 エラー メッセージの解釈でサポートが必要な場合は、 MongoDB サポート にお問い合わせください。

このアラートはグローバルアラートとしてのみ使用できます。

これらのアラート条件は、 BI ConnectorとMongoDB Ops Managerの使用に適用されます。

条件
アラートtrigger
BI Connector is down

オートメーションが少なくとも 4 分間、BI Connector プロセスを検出しませんでした。

重要: オートメーションがダウンすると、MongoDB Ops Manager triggerBI Connectorは のアラートを できません。

ユーザーの追加、削除、ロールの変更に対してアラートを設定できます。 ユーザー条件には、次のものが含まれます。

条件
アラートtrigger
ユーザーがプロジェクトに参加しました
新しいユーザーがプロジェクトに参加します。
ユーザーはプロジェクトを離れる
ユーザーがプロジェクトを離れる。
ユーザーのロールが変更されました
ユーザーのロールが変更されました。

ユーザーの承認と認証構成にアラートを設定できます。 プロジェクト条件には、次のものが含まれます。

条件
アラートtrigger
ユーザーは 2 要素認証を有効にしていない
セキュリティチェックアラートの更新
プロジェクトのセキュリティチェックアラートが変更されました。

戻る

アラートの構成と解決