アーカイブされたデータの復元

項目一覧

必要なアクセス権
手順

重要

フレキシブルなクラスターとサーバーレスインスタンスで使用できない機能

Flex クラスターとサーバーレスインスタンスは現時点ではこの機能をサポートしていません。詳細については、「Atlas Flex の制限」と「サーバーレスインスタンスの制限」を参照してください。

アーカイブされたデータは Atlas クラスターに復元できます。 Atlas Data Federation が$mergeパイプラインステージに対して提供する代替構文を使用して、同じ Atlas プロジェクト内の同じまたは異なる Atlas クラスター、データベース、またはコレクションにデータを移動できます。

注意

クラスターがアーカイブから復元されるデータ量に十分にプロビジョニングされていることを確認し、アーカイブデータの復元中または復元後にスペースが不足しないようにしてください。 oplog のサイズ設定に関する追加の技術ガイダンスや、Atlas クラスターのスペースの問題のトラブルシューティングについては、サポートにお問い合わせください。

このページでは、 $mergeパイプラインステージまたは MongoDB ツールを使用してアーカイブデータを復元する方法について説明します。

必要なアクセス権

この手順に従うには、プロジェクトに対するProject Data Access Admin以上のアクセス権が必要です。

手順

データセットが小さい場合は、 $mergeステージを使用してアーカイブデータを Atlas クラスターに移動できます。このアプローチは、多数のパーティションを持つ大規模なデータセット（約1 TB のデータ）には推奨されません。

アーカイブ済みデータを復元するコレクションに関連付けられている Atlas Online Archive を一時停止します。

詳細については、「アーカイブの一時停止と再開」を参照してください。

接続文字列を使用して Atlas Online Archive に接続します。

Atlas Online Archive に接続するには、Archive Only 接続stringを使用する必要があります。詳細については、「 Atlas Online Archive への接続」を参照してください。

`$merge`を使用して、アーカイブから Atlas クラスターにデータを移動します。

Atlas クラスターにデータを移動するための$mergeパイプラインステージの構文と使用方法の詳細については、 $mergeパイプラインステージを参照してください。

例

S3アーカイブ内の次のドキュメントを検討します。

{
  "_id" : 1,
  "item": "cucumber",
  "source": "nepal",
  "released": ISODate("2016-05-18T16:00:00Z")
}
{
  "_id" : 2,
  "item": "miso",
  "source": "canada",
  "released": ISODate("2016-05-18T16:00:00Z")
}
{
  "_id" : 3,
  "item": "oyster",
  "source": "luxembourg",
  "released": ISODate("2016-05-18T16:00:00Z")
}
{
  "_id" : 4,
  "item": "mushroom",
  "source": "ghana",
  "released": ISODate("2016-05-18T16:00:00Z")
}

$mergeこれらのドキュメントを Atlas クラスターに復元するためのitem 構文では、source $mergeステージ中にフィールドとフィールドに基づいてドキュメントが識別されます。

db.<collection>.aggregate([
  {
    "$merge": {
      "into": {
        "atlas": {
          "clusterName": "<atlas-cluster-name>",
          "db": "<db-name>",
          "coll": "<collection-name>"
        }
      },
      "on": [ "item", "source" ],
      "whenMatched": "keepExisting",
      "whenNotMatched": "insert"
    }
  }
])

この例では、アーカイブされたドキュメントが Atlas クラスターの 2 つのフィールドにあるドキュメントと一致する場合、Atlas は既存のドキュメントをクラスターに保持します。Atlas クラスター上のドキュメントのコピーはアーカイブ内のドキュメントのコピーよりも新しいためです。。アーカイブされたドキュメントが Atlas クラスター内のどのドキュメントとも一致しない場合、Atlas は Atlas クラスター上の指定されたコレクションにドキュメントを挿入します。

Atlas クラスターにデータを復元する場合、アーカイブされたデータに重複する_idフィールドが含まれる場合があります。この例では、ステージの前にフィールドと $mergeフィールドでソートするためのステージを含めることができ、解決する重複がある場合に Atlas$sort が最新の日付を持つドキュメントを選択するようにします。_idreleased

注意

複数のonフィールドがある場合は、 on識別子フィールドに複合一意のインデックスを作成する必要があります。

db.<collection>.createIndex( { item: 1, source: 1 }, {
unique: true } )

または、一時コレクションに対して、 on識別子フィールドごとに 1 つずつ、マージを順番に指定します。次に、クラスターの接続文字列を使用して、一時コレクションのデータをターゲットコレクションにマージします。引き続き、各 on 識別子フィールドに一意のインデックスを作成する必要があります。

集計ステージは、 backgroundフラグをtrueに設定することで、バックグラウンドで実行できます。 mongoshでこのコマンドを実行するには、 db.runCommandを使用します。

db.runCommand(
  "aggregate": "<collection>",
  "pipeline": [
    {
      $sort: {
        "_id": 1,
        "released": 1,
      }
    },
    {
      "$merge": {
        "into": {
          "atlas": {
            "clusterName": "<atlas-cluster-name>",
            "db": "<db-name>",
            "coll": "<collection-name>"
          }
        },
        "on": [ "item", "source" ],
        "whenMatched": "keepExisting",
        "whenNotMatched": "insert"
      }
    }
  ], {"background": true}
)

重複フィールドの解決の詳細については、 $merge に関する考慮事項を参照してください。

Atlas クラスター内のデータを確認し、オンラインアーカイブを削除します。

詳細については、「 Atlas Online Archive の削除」を参照してください。

注意

Atlas クラスターへのデータの移行中に問題が発生した場合は、サポートにお問い合わせください。

戻る

Atlas Online Archive のバックアップ

クエリログのダウンロード