Configurar uma instância de banco de dados federado para seu conjunto de dados - Visualização
Nesta página
Esta página orienta você nas etapas de criação de uma instância do banco de dados federado para seu conjunto de dados de ingestão de dados.
Pré-requisitos
Antes de começar, você deve ter o seguinte:
Um conjunto de dados Atlas Data Lake no mesmo projeto onde você pretende criar a instância do banco de dados federado.
Project Owner
para o projeto onde você deseja criar a instância do banco de dados federado.
Procedimento
Faça login no MongoDB Atlas.
Go para Atlas Data Federation na Atlas interface do usuário do.
Se ainda não estiver exibido, selecione a organização que contém seu projeto no menu Organizations na barra de navegação.
Se ainda não estiver exibido, selecione seu projeto no menu Projects na barra de navegação.
Na barra lateral, clique em Data Federation sob o título Services.
Crie reconhecimento de data center virtuais, collection e exibições e mapeie-os para seu conjunto de dados do ingestão de dados.
Siga as etapas na guia abaixo para obter sua visualização preferida do Editor na interface do usuário.
(Opcional) Clique em para o:
Federated Database Instance para especificar um nome para a instância do banco de dados federado. Padrão é
FederatedDatabaseInstance[n]
.Banco de dados para editar o nome do banco de dados. Padrão é
Database[n]
.Corresponde à configuração JSON do
databases.[n].name
.Coleção para editar o nome da coleção. O padrão é
Collection[n]
.Corresponde à configuração JSON do
databases.[n].collections.name
.Visualizar para editar o nome da visualização.
Você pode clicar em:
Add Database para adicionar bancos de dados e coleções.
associado ao banco de dados para adicionar coleções ao banco de dados.
associado à collection para adicionar visualizações na collection. Para criar uma visualização, você deve especificar:
O nome da visualização.
O pipeline a ser aplicado à visualização.
Observação
O pipeline de definição de visualização não pode incluir o estágio
$out
ou$merge
. Se a definição de visualização incluir estágios de pipeline aninhados, como$lookup
ou$facet
, essa restrição também se aplicará a esses pipelines aninhados.Para saber mais sobre visualizações, consulte:
associado ao banco de dados, coleção ou visualização para removê-la.
Observação
As query de amostra que você pode executar mais tarde neste tutorial utilizam os nomes
Database0
para o nome do reconhecimento de data center virtual eCollection0
para o nome da collection virtual. Se você modificar os nomes aqui, certifique-se de modificar os nomes nas query de exemplo também antes de executá-los.Arraste e solte o Data Lake Dataset para mapear com a collection.
Exemplo
Se você estiver criando uma Instância do Banco de Dados Federado para o conjunto de dados do Atlas Data Lake criado para os dados de amostra usando os exemplos em Criar um Pipeline do Atlas Data Lake - Visualização:
Em Datasets, selecione Ingestion Pipeline no menu suspenso se ainda não estiver selecionado.
Na seção Data Lake Dataset , arraste o conjunto de dados chamado
sample_mflix.movies
e solte-o na coleção.
Corresponde à configuração JSON do
databases.[n].collections.[n].dataSources
.
Defina seu conjunto de dados como um armazenamento de dados em sua configuração de armazenamento de Instância do Banco de Dados Federado.
Edite as definições de configuração JSON mostradas na interface do usuário para
stores
. Sua configuração de configuração dostores
deve ser semelhante ao seguinte:{ "stores": [ { "name": "<store-name>", "provider": "<cloud-storage-provider-name>", "region": "<cloud-storage-provider-region>" } ] } Para saber mais sobre essas configurações, consulte Configuração de armazenamento para conjuntos de Atlas Data Lake .
Exemplo
Se você estiver criando uma Instância de Banco de Dados Federado para o pipeline Atlas Data Lake que você criou para os dados de exemplo utilizando os exemplos em Criar um Atlas Data Lake Pipeline - Visualização, substitua o
stores
nas definições de configuração JSON mostradas na UI pelo seguinte:{ "stores": [ { "name": "dls-store-us-east-1", "provider": "dls:aws", "region": "US_EAST_1" } ] } Defina bancos de dados virtuais, collections e visualizações para o seu conjunto de dados na configuração de armazenamento do Atlas Data Federation .
{ "databases": [ { "name": "<database-name>", "collections": [ { "name": "<collection-name>", "dataSources": [ { "storeName": "<store-name>", "datasetName": "<snapshot-name>" } ] } ], "views": [] } ] } Para saber mais sobre essas configurações, consulte Configuração de armazenamento para conjuntos de Atlas Data Lake .
Exemplo
Se você estiver criando uma Instância do Banco de Dados Federado para o conjunto de dados do Atlas Data Lake que você criou para os dados de amostra utilizando os exemplos em Criar um Pipeline do Atlas Data Lake - Visualização, substitua o
databases
nas definições de configuração JSON mostradas na UI pelo seguinte:{ "databases": [ { "name": "Database0", "collections": [ { "name": "Collection0", "dataSources": [ { "storeName": "dls-store-us-east-1", "datasetName": "v1$atlas$snapshot$dlsTest$sample_mflix$movies$$.<snapshot-id>" } ] } ], "views": [] } ] }
Próximos passos
Agora que você criou uma Instância de banco de dados federado para seu conjunto de dados do Data Lake, vá para Conectar-se à sua instância de banco de dados federado - Visualização.