部署一个联合数据库实例。
本页介绍如何部署联合数据库实例来访问GoogleGoogle Cloud Platform Cloud Platform存储桶中的数据。
必需的访问权限
要部署联合数据库实例,您必须对项目拥有 Project Owner
访问权限。 在部署联合数据库实例之前,具有Organization Owner
访问权限的用户必须将自己作为Project Owner
添加到项目中。
先决条件
在开始之前,您需要:
创建一个 MongoDB Atlas帐户(如果您还没有帐户)。
配置 gcloudCLI CLI以访问权限您的Google CloudGoogle Cloud Platform Platform帐户。或者,您必须有权访问权限GoogleGoogle Cloud Platform Cloud Platform控制台并有权创建 IAM 角色。
步骤
要使用 Atlas CLI 创建新的 Data Federation 数据库,请运行以下命令:
atlas dataFederation create <name> [options]
要学习;了解有关命令语法和参数的更多信息,请参阅Atlas CLI AtlasdataFederation create 的 文档。
指定您的GoogleGoogle Cloud Platform Cloud Platform存储桶,并配置映射到您的数据存储的联合数据库和虚拟集合。
从Data Sources部分选择联合数据库实例的数据集。
单击Add Data Sources选择您的数据存储。
指定您的数据存储。
Google Cloud Storage选择Google Cloud Platform ,为Google Cloud Platform存储桶中的数据配置联合数据库实例。
与
stores.[n].provider
JSON 配置设置对应。为Atlas选择一个Google Google Cloud PlatformCloud Platform服务帐户。Atlas
Google Cloud Platform您可以从角色选择下拉列表中选择Atlas已获得授权的现有Google Cloud Platform服务帐户,也可以选择Atlas Create a Google Service Account。
如果您选择了Atlas已获得授权的现有帐户,请单击 并继续下一步,列出您的GoogleAtlas NextGoogle Cloud PlatformCloud Platform存储桶。
如果要创建新的服务帐户,请选择 Create a Google Service Account 并单击 Next。
提示
另请参阅:
设置和管理GoogleGoogle Cloud Platform Cloud Platform服务帐户访问 </security/set-up-unified-aws-access/>`
在Configure Google Cloud Storage 模式中,按照提供的说明配置Google Cloud Platform CLIGoogle Cloud PlatformCLI Next,然后单击 。
配置Google Cloud PlatformGoogle Cloud Platform Storage。
输入您的GoogleGoogle Cloud Platform Cloud Platform存储桶的名称。
对应于
stores.[n].bucket
JSON配置设置。指定存储桶是Read-only还是同时是Read and write 。
AtlasRead-onlyAtlas只能查询 存储桶;如果您希望查询并将查询结果保存到GoogleGoogle Cloud Platform Cloud Platform存储桶,请选择Read and write 。
选择GoogleGoogle Cloud Platform Cloud Platform Storage 存储桶的地区。
对应于
stores.[n].region
JSON配置设置。注意
Atlas Data Federation如果AtlasGCP Data Federation无法检索指定GCP存储桶的地区,则无法创建联合数据库实例。
授予对GoogleGoogle Cloud Platform Cloud Platform项目的访问权限。
Google Cloud Platform在托管GoogleGoogle Cloud Platform Cloud Platform存储桶的项目的Google Cloud Platform控制台中,导航到IAM and Admin ,然后导航到IAM 。
单击 Grant Access。New principals在出现的模式中,在Google Cloud Platform 字段,输入与您的联合数据库实例关联的Google Cloud Platform服务帐户。
要授予存储桶只读访问权限,请应用
storage.viewer
角色。要授予对存储桶的读写访问权限,请另外应用storage.editor
角色。
可选。指定DataData Federation Federation在GoogleGoogle Cloud Platform Cloud Platform存储桶中搜索文件时应使用的前缀。如果省略,Data Federation Google Cloud PlatformData Federation将从Google Cloud Platform Storage 存储桶的根目录开始递归搜索所有文件。
对应于
stores.[n].prefix
JSON配置设置。单击 Validate and finish.
为GoogleGoogle Cloud Platform Cloud Platform Storage 存储桶中的文件定义路径结构,然后单击Next 。
例如:
https://storage.googleapis.com/<path>/<to>/<files>/<filename>.<file-extension> 要为Google CloudGoogle Cloud Platform Add Data SourcePlatform存储桶上的数据添加其他路径,请单击 并输入路径。要学习;了解有关路径的更多信息,请参阅为 S3 数据定义路径。
对应于
databases.[n].collections.[n].dataSources.[n].path
JSON配置设置。创建虚拟数据库、集合和视图,并将数据库、集合和视图映射到数据存储。
(可选)单击对于:
数据库,用于编辑数据库名称。默认值为
VirtualDatabase[n]
。与
databases.[n].name
JSON 配置设置对应。集合,可编辑集合名称。 默认值为
VirtualCollection[n]
。与
databases.[n].collections.[n].name
JSON 配置设置对应。视图,用于编辑视图名称。
您可以单击:
从Data Sources部分的下拉列表中选择Google Cloud Storage 。
拖放数据存储以与集合映射。
与
databases.[n].collections.[n].dataSources
JSON 配置设置对应。
GoogleGoogle Cloud Platform Cloud Platform Storage 数据存储的配置应如下所示:
{ "stores" : [ { "name" : "<string>", "provider" : "<string>", "region" : "<string>", "bucket" : "<string>", "prefix": "<string>", "delimiter": "<string>" } ], "databases" : [ { "name" : "<string>", "collections" : [ { "name" : "<string>", "dataSources" : [ { "storeName" : "<string>", "path" : "<string>", "defaultFormat" : "<string>", "provenanceFieldName": "<string>", "omitAttributes": <boolean> } ] } ], "maxWildcardCollections" : <integer>, "views" : [ { "name" : "<string>", "source" : "<string>", "pipeline" : "<string>" } ] } ] }
有关配置设置的更多信息,请参阅为联合数据库实例定义数据存储。
定义您的Amazon Web Services S3 数据存储。
编辑
stores
用户界面中显示的JSON配置设置。 您的stores
配置设置应如下所示:"stores" : [ { "name" : "<string>", "provider" : "<string>", "region" : "<string>", "bucket" : "<string>", "additionalStorageClasses" : ["<string>"], "prefix" : "<string>", "delimiter" : "<string>", "includeTags": <boolean>, "public": <boolean> } ] 要学习;了解有关这些配置设置的更多信息,请参阅
stores
。定义联合数据库实例虚拟数据库、集合和视图。
编辑
databases
用户界面中显示的JSON配置设置。 您的databases
配置设置应如下所示:"databases" : [ { "name" : "<string>", "collections" : [ { "name" : "<string>", "dataSources" : [ { "storeName" : "<string>", "defaultFormat" : "<string>", "path" : "<string>", "provenanceFieldName": "<string>", "omitAttributes": <boolean> } ] } ], "maxWildcardCollections" : <integer>, "views" : [ { "name" : "<string>", "source" : "<string>", "pipeline" : "<string>" } ] } ] 要学习;了解有关这些配置设置的更多信息,请参阅
databases
。
可选:重复上述“可视化编辑器”或“ JSON编辑器”标签页中的步骤,定义其他Azure Azure Blob 存储数据存储。
要为联合查询添加其他数据存储,请参阅:
注意
无法连接 Azure Blob 存储数据存储来跨云提供商运行联合查询。