Docs 菜单
Docs 主页
/ /
MongoDB Atlas Data Lake
/

为数据集设置联合数据库实例 — 预览

在此页面上

  • 先决条件
  • 步骤
  • 后续步骤

本页面将指导您完成创建 Data Lake 数据集的 联合数据库实例的步骤。

在开始之前,您必须具备以下条件:

1
2
  1. 如果尚未显示,请选择包含您的项目的组织导航栏中的 Organizations菜单。

  2. 如果尚未显示,请从导航栏的 Projects 菜单中选择您的项目。

  3. 在侧边栏中,单击 Services 标题下的 Data Federation

3
4
  • 要获得引导式体验,请启用Visual Editor 。 (默认)

  • 要编辑原始JSON ,请禁用Visual Editor

5

请按照下面选项卡中的步骤,在用户界面选择首选的“编辑器”视图。

  1. (可选)单击对于:

    • Federated Database Instance 来指定联合数据库实例的名称。默认值为 FederatedDatabaseInstance[n]

    • 数据库,用于编辑数据库名称。默认值为 Database[n]

      databases.[n].name JSON 配置设置对应。

    • 集合,可编辑集合名称。 默认值为 Collection[n]

      databases.[n].collections.name JSON 配置设置对应。

    • 视图,用于编辑视图名称。

    您可以单击:

    • Add Database 添加数据库和集合。

    • 与数据库关联, 以便将集合添加到数据库中。

    • 与集合关联,以添加关于集合的视图。 要创建视图,必须指定:

      • 视图的名称。

      • 应用于视图的管道

        注意

        视图定义管道不能包含$out$merge阶段。 如果视图定义包含嵌套管道阶段,例如$lookup$facet ,则此限制也适用于这些嵌套管道。

        要学习;了解有关视图的更多信息,请参阅:

      • 与数据库、集合或视图关联, 以便予以删除。

    注意

    本教程稍后运行的查询使用Database0作为虚拟数据库名称, Collection0作为虚拟collection名称。 如果在这里修改了名称,请确保在运行之前也修改了示例查询中的名称。

  2. 拖放Data Lake Dataset以与collection映射。

    例子

    如果您要为Atlas Data Lake数据集创建“联合数据库实例”,而该数据集是您使用创建Atlas Data Lake管道 - 预览中的示例为示例数据创建的:

    1. Datasets下,如果尚未选择,请从下拉列表中选择Ingestion Pipeline

    2. Data Lake Dataset部分下,将名为sample_mflix.movies的数据集拖放到collection下。

    databases.[n].collections.[n].dataSources JSON 配置设置对应。

  1. 将数据集定义为联合数据库实例存储配置中的数据存储。

    编辑stores用户界面中显示的JSON配置设置。 您的stores配置设置应如下所示:

    {
    "stores": [
    {
    "name": "<store-name>",
    "provider": "<cloud-storage-provider-name>",
    "region": "<cloud-storage-provider-region>"
    }
    ]
    }

    要学习;了解有关这些设置的更多信息,请参阅Atlas Data Lake数据集的存储配置。

    例子

    如果您要为Atlas Data Lake管道创建联合数据库实例,该管道是您使用创建Atlas Data Lake管道 - 预览中的示例为示例数据创建的,请将用户界面中显示的JSON配置设置中的stores替换为以下:

    {
    "stores": [
    {
    "name": "dls-store-us-east-1",
    "provider": "dls:aws",
    "region": "US_EAST_1"
    }
    ]
    }
  2. 在Atlas Data Federation存储配置中为数据集定义虚拟数据库、集合和视图。

    {
    "databases": [
    {
    "name": "<database-name>",
    "collections": [
    {
    "name": "<collection-name>",
    "dataSources": [
    {
    "storeName": "<store-name>",
    "datasetName": "<snapshot-name>"
    }
    ]
    }
    ],
    "views": []
    }
    ]
    }

    要学习;了解有关这些设置的更多信息,请参阅Atlas Data Lake数据集的存储配置。

    例子

    如果您要为Atlas Data Lake数据集创建联合数据库实例,该数据集是您使用创建Atlas Data Lake管道 - 预览中的示例为示例数据创建的,请将用户界面中显示的JSON配置设置中的databases替换为以下:

    {
    "databases": [
    {
    "name": "Database0",
    "collections": [
    {
    "name": "Collection0",
    "dataSources": [
    {
    "storeName": "dls-store-us-east-1",
    "datasetName": "v1$atlas$snapshot$dlsTest$sample_mflix$movies$$.<snapshot-id>"
    }
    ]
    }
    ],
    "views": []
    }
    ]
    }
6

现在您已经为Atlas 数据湖数据集创建了联合数据库实例,请继续连接到您的联合数据库实例 - 预览。

后退

第 1 步:创建 Data Lake 管道