Distribua uma instância de banco de dados federado
Nesta página
Esta página descreve como implantar uma instância do banco de dados federado para acessar dados em seus buckets de armazenamento do Google Google Cloud Platform Cloud Platform.
Acesso necessário
Para implantar uma instância do banco de dados federado, você deve ter acesso do Project Owner
ao projeto. Os usuários com acesso Organization Owner
devem se adicionar como Project Owner
ao projeto antes de implantar uma instância do banco de dados federado.
Pré-requisitos
Antes de começar, você precisará:
Crie uma conta do MongoDB Atlas , se ainda não tiver uma.
Configure a CLI do gcloud CLI para acessar sua conta do Google Google Cloud Platform Cloud Platform. Como alternativa, você deve ter acesso ao console do Google Google Cloud Platform Cloud Platform com permissão para criar funções de IAM.
Opcional. Configure uma Google Cloud Platform conta de serviço do Google Cloud Platform.
Procedimento
Para criar um novo reconhecimento de data center Data Federation utilizando o Atlas CLI, execute o seguinte comando:
atlas dataFederation create <name> [options]
Para saber mais sobre a sintaxe e os parâmetros do comando, consulte a documentação do Atlas CLI para criar o Atlas dataFederation.
Selecione o provedor de nuvem onde o Atlas Data Federation processará suas queries em relação à sua instância do banco de dados federado.
Você pode selecionar Amazon Web Services Azure Google Cloud PlatformAmazon Web Services , Azure ou Google Cloud Platform . Após sua instância do banco de dados federado ser criada, você não poderá alterar o provedor de nuvem onde o Atlas Data Federation processa suas queries.
Você deve configurar sua instância do banco de dados federado no mesmo provedor de nuvem que os armazenamentos de dados para os quais sua instância do banco de dados federado mapeia.
Especifique seu Google Cloud Platform bucket de armazenamento da Google Cloud Platform e configure bancos de dados federados e coleções virtuais que mapeiam para seu armazenamento de dados.
Selecione o conjunto de dados para sua instância do banco de dados federado na seção Data Sources .
Clique em Add Data Sources para selecionar seu armazenamento de dados.
Especifique seu armazenamento de dados.
Escolha Google Cloud Storage para configurar uma instância do banco de dados federado para dados em Google Cloud Platform buckets de armazenamento do Google Cloud Platform.
Corresponde à configuração JSON do
stores.[n].provider
.Selecione uma conta do Google Cloud Platform Service para o Atlas.Google Cloud Platform
Você pode selecionar uma Google Cloud Platform conta de serviço da Google Cloud Platform existente para a qual o Atlas está autorizado na lista suspensa de seleção de função ou Create a Google Service Account escolher.
Se você selecionou uma conta existente para a qual o Atlas está autorizado, clique em Next e prossiga para a próxima etapa para listar seus Google Cloud Platform buckets de armazenamento da Google Cloud Platform.
Se você estiver criando uma nova conta de serviço, selecione Create a Google Service Account e clique em Next.
Dica
Veja também:
Configurar e gerenciar Google Cloud Platform o acesso à conta de serviço do Google Cloud Platform ://security/set-up-unified-aws-access/>'
No Configure Google Cloud Storage modal, siga as instruções fornecidas para configurar a CLI do Google Cloud Google Cloud Platform CLI NextPlatform e clique em.
Configure o Google Cloud Platform armazenamento do Google Cloud Platform.
Insira o nome do Google Cloud Platform bucket de armazenamento do Google Cloud Platform.
Corresponde à
stores.[n].bucket
configuração JSON.Especifique se o bucket é Read-only ou ambos Read and write.
O Atlas só pode executar query Read-only de buckets; se quiser consultar e salvar os resultados da consulta em seu Google Cloud Platform Read and writecontêiner Armazenamento do Google Cloud Platform, escolha.
Selecione a região do Google Cloud Platform bucket de armazenamento do Google Cloud Platform.
Corresponde à
stores.[n].region
configuração JSON.Observação
Não é possível criar uma instância do banco de dados federado se o Atlas Data Federation não conseguir recuperar a região do GCP bucket de armazenamento do GCP especificado.
Conceda acesso ao seu Google Cloud Platform projeto do Google Cloud Platform.
No Google Cloud Platform console da Google Cloud Platform do projeto que hospeda seu Google Cloud Platform bucket de armazenamento da Google Cloud Platform, navegue até IAM and Admin e, em seguida, navegue IAM até.
Clique em Grant Access. No modal exibido, no New principals campo, insira a Google Cloud Platform conta de serviço da Google Cloud Platform associada à sua instância do banco de dados federado.
Para conceder acesso de somente leitura ao bucket, aplique a função
storage.viewer
. Para conceder acesso de leitura e gravação ao bucket, aplique adicionalmente a funçãostorage.editor
.
Opcional. Especifique um prefixo que a Data Federation deve usar ao pesquisar os arquivos no bucket de armazenamento da Google Google Cloud Platform Cloud Platform. Se omitido, o Data Federation faz uma pesquisa recursiva para todos os arquivos a partir da raiz do bucket de armazenamento do Google Google Cloud Platform Cloud Platform.
Corresponde à
stores.[n].prefix
configuração JSON.Clique em Validate and finish.
Defina a estrutura de caminho para seus arquivos no Google Cloud Platform bucket de armazenamento da Google Cloud Platform e clique Next em.
Por exemplo:
https://storage.googleapis.com/<path>/<to>/<files>/<filename>.<file-extension> Para adicionar caminhos adicionais para dados em seu Google Cloud Platform contêiner de armazenamento do Google Cloud Platform, clique Add Data Source em e insira o caminho. Para saber mais sobre caminhos, consulte Definir caminho para dados S3 .
Corresponde à
databases.[n].collections.[n].dataSources.[n].path
configuração JSON.Crie os bancos de dados, collections e visualizações virtuais e mapeie os bancos de dados, collections e visualizações para seu armazenamento de dados.
(Opcional) Clique em para o:
Banco de dados para editar o nome do banco de dados. Padrão é
VirtualDatabase[n]
.Corresponde à configuração JSON do
databases.[n].name
.Coleção para editar o nome da coleção. O padrão é
VirtualCollection[n]
.Corresponde à configuração JSON do
databases.[n].collections.[n].name
.Visualizar para editar o nome da visualização.
Você pode clicar em:
Add Database para adicionar bancos de dados e coleções.
associado ao banco de dados para adicionar coleções ao banco de dados.
associado à collection para adicionar visualizações na collection. Para criar uma visualização, você deve especificar:
O nome da visualização.
O pipeline a ser aplicado à visualização.
O pipeline de definição de visualização não pode incluir o estágio
$out
ou$merge
. Se a definição de visualização incluir estágios de pipeline aninhados, como$lookup
ou$facet
, essa restrição também se aplicará a esses pipelines aninhados.
Para saber mais sobre visualizações, consulte:
associado ao banco de dados, coleção ou visualização para removê-la.
Selecione Google Cloud Storage no menu suspenso da seção Data Sources .
Arraste e solte o armazenamento de dados para mapear com a collection.
Corresponde à configuração JSON do
databases.[n].collections.[n].dataSources
.
Sua configuração do Google Cloud Platform armazenamento de dados do Google Cloud Platform Storage deve ser semelhante a esta:
{ "stores" : [ { "name" : "<string>", "provider" : "<string>", "region" : "<string>", "bucket" : "<string>", "prefix": "<string>", "delimiter": "<string>" } ], "databases" : [ { "name" : "<string>", "collections" : [ { "name" : "<string>", "dataSources" : [ { "storeName" : "<string>", "path" : "<string>", "defaultFormat" : "<string>", "provenanceFieldName": "<string>", "omitAttributes": <boolean> } ] } ], "maxWildcardCollections" : <integer>, "views" : [ { "name" : "<string>", "source" : "<string>", "pipeline" : "<string>" } ] } ] }
Para obter mais informações sobre as definições de configuração, consulte Definir armazenamentos de dados para uma instância de banco de dados federado.
Defina seu armazenamento de dados do Amazon Web Services S3.
Edite as definições de configuração JSON mostradas na interface do usuário para
stores
. Sua configuração de configuração dostores
deve ser semelhante ao seguinte:"stores" : [ { "name" : "<string>", "provider" : "<string>", "region" : "<string>", "bucket" : "<string>", "additionalStorageClasses" : ["<string>"], "prefix" : "<string>", "delimiter" : "<string>", "includeTags": <boolean>, "public": <boolean> } ] Para saber mais sobre essas definições de configuração, consulte
stores
.Defina seus bancos de dados virtuais, collections e visualizações de instância do banco de dados federado .
Edite as definições de configuração JSON mostradas na interface do usuário para
databases
. Sua configuração de configuração dodatabases
deve ser semelhante ao seguinte:"databases" : [ { "name" : "<string>", "collections" : [ { "name" : "<string>", "dataSources" : [ { "storeName" : "<string>", "defaultFormat" : "<string>", "path" : "<string>", "provenanceFieldName": "<string>", "omitAttributes": <boolean> } ] } ], "maxWildcardCollections" : <integer>, "views" : [ { "name" : "<string>", "source" : "<string>", "pipeline" : "<string>" } ] } ] Para saber mais sobre essas definições de configuração, consulte
databases
.
Opcional: repita as etapas na aba Editor Visual ou Editor JSON acima para definir armazenamentos de dados adicionais do Azure Azure Blob Storage.
Para adicionar outros armazenamentos de dados para consultas federadas, consulte:
Observação
Você não pode conectar um armazenamento de dados do Azure Blob Storage para executar consultas federadas em fornecedores de nuvem.