为数据集设置联合数据库实例 — 预览
本页面将指导您完成创建 Data Lake 数据集的 联合数据库实例的步骤。
先决条件
在开始之前,您必须具备以下条件:
您打算在其中创建联合数据库实例的同一项目中的 Atlas Data Lake 数据集。
Project Owner
您想要创建联合数据库实例的 项目的角色。
步骤
登录 MongoDB Atlas 。
创建虚拟数据库、collection和视图,并将它们映射到 data lake 数据集。
请按照下面选项卡中的步骤,在用户界面选择首选的“编辑器”视图。
(可选)单击对于:
Federated Database Instance 来指定联合数据库实例的名称。默认值为
FederatedDatabaseInstance[n]
。数据库,用于编辑数据库名称。默认值为
Database[n]
。与
databases.[n].name
JSON 配置设置对应。集合,可编辑集合名称。 默认值为
Collection[n]
。与
databases.[n].collections.name
JSON 配置设置对应。视图,用于编辑视图名称。
您可以单击:
Add Database 添加数据库和集合。
与数据库关联, 以便将集合添加到数据库中。
与集合关联,以添加关于集合的视图。 要创建视图,必须指定:
视图的名称。
应用于视图的管道。
注意
视图定义管道不能包含
$out
或$merge
阶段。 如果视图定义包含嵌套管道阶段,例如$lookup
或$facet
,则此限制也适用于这些嵌套管道。要学习;了解有关视图的更多信息,请参阅:
与数据库、集合或视图关联, 以便予以删除。
注意
本教程稍后运行的查询使用
Database0
作为虚拟数据库名称,Collection0
作为虚拟collection名称。 如果在这里修改了名称,请确保在运行之前也修改了示例查询中的名称。拖放Data Lake Dataset以与collection映射。
例子
如果您要为Atlas Data Lake数据集创建“联合数据库实例”,而该数据集是您使用创建Atlas Data Lake管道 - 预览中的示例为示例数据创建的:
在Datasets下,如果尚未选择,请从下拉列表中选择Ingestion Pipeline 。
在Data Lake Dataset部分下,将名为
sample_mflix.movies
的数据集拖放到collection下。
与
databases.[n].collections.[n].dataSources
JSON 配置设置对应。
将数据集定义为联合数据库实例存储配置中的数据存储。
编辑
stores
用户界面中显示的JSON配置设置。 您的stores
配置设置应如下所示:{ "stores": [ { "name": "<store-name>", "provider": "<cloud-storage-provider-name>", "region": "<cloud-storage-provider-region>" } ] } 要学习;了解有关这些设置的更多信息,请参阅Atlas Data Lake数据集的存储配置。
例子
如果您要为Atlas Data Lake管道创建联合数据库实例,该管道是您使用创建Atlas Data Lake管道 - 预览中的示例为示例数据创建的,请将用户界面中显示的JSON配置设置中的
stores
替换为以下:{ "stores": [ { "name": "dls-store-us-east-1", "provider": "dls:aws", "region": "US_EAST_1" } ] } 在Atlas Data Federation存储配置中为数据集定义虚拟数据库、集合和视图。
{ "databases": [ { "name": "<database-name>", "collections": [ { "name": "<collection-name>", "dataSources": [ { "storeName": "<store-name>", "datasetName": "<snapshot-name>" } ] } ], "views": [] } ] } 要学习;了解有关这些设置的更多信息,请参阅Atlas Data Lake数据集的存储配置。
例子
如果您要为Atlas Data Lake数据集创建联合数据库实例,该数据集是您使用创建Atlas Data Lake管道 - 预览中的示例为示例数据创建的,请将用户界面中显示的JSON配置设置中的
databases
替换为以下:{ "databases": [ { "name": "Database0", "collections": [ { "name": "Collection0", "dataSources": [ { "storeName": "dls-store-us-east-1", "datasetName": "v1$atlas$snapshot$dlsTest$sample_mflix$movies$$.<snapshot-id>" } ] } ], "views": [] } ] }
后续步骤
现在您已经为Atlas 数据湖数据集创建了联合数据库实例,请继续连接到您的联合数据库实例 - 预览。