Configurar uma instância de banco de dados federado para seu conjunto de dados - Visualização

Nesta página

Pré-requisitos

Procedimento
Próximos passos

O Data Lake está obsoleto. A partir de 2024 de setembro , o Data Lake está obsoleto e chegará ao fim da vida útil. Ele será removido em 30 de setembro de 2025. Se você usa o Data Lake, deve migrar para soluções alternativas antes que o serviço seja removido. Para saber mais, consulte Guia de Descontinuação do Atlas Data Lake.

Esta página orienta você nas etapas de criação de uma instância do banco de dados federado para seu conjunto de dados de ingestão de dados.

Pré-requisitos

Antes de começar, você deve ter o seguinte:

Um conjunto de dados Atlas Data Lake no mesmo projeto onde você pretende criar a instância do banco de dados federado.
Project Owner para o projeto onde você deseja criar a instância do banco de dados federado.

Procedimento

Faça login no MongoDB Atlas.

Go para Atlas Data Federation na Atlas interface do usuário do.

Se ainda não estiver exibido, selecione a organização que contém seu projeto no menu Organizations na barra de navegação.
Se ainda não estiver exibido, selecione seu projeto no menu Projects na barra de navegação.
Na barra lateral, clique em Data Federation sob o título Services.

Clique em Create Federated Database.

Selecione o método de configuração.

Para uma experiência guiada, habilite Visual Editor. (Padrão)
Para editar o JSON bruto, desabilite o Visual Editor.

Crie reconhecimento de data center virtuais, collection e exibições e mapeie-os para seu conjunto de dados do ingestão de dados.

Siga as etapas na guia abaixo para obter sua visualização preferida do Editor na interface do usuário.

(Opcional) Clique em para o:
- Federated Database Instance para especificar um nome para a instância do banco de dados federado. Padrão é FederatedDatabaseInstance[n].
- Banco de dados para editar o nome do banco de dados. Padrão é Database[n].
  Corresponde à configuração JSON do databases.[n].name.
- Coleção para editar o nome da coleção. O padrão é Collection[n].
  Corresponde à configuração JSON do databases.[n].collections.name.
- Visualizar para editar o nome da visualização.
Você pode clicar em:
- Add Database para adicionar bancos de dados e coleções.
- associado ao banco de dados para adicionar coleções ao banco de dados.
- associado à collection para adicionar visualizações na collection. Para criar uma visualização, você deve especificar:
  - O nome da visualização.
  - O pipeline a ser aplicado à visualização.
    Observação
    O pipeline de definição de visualização não pode incluir o estágio $out ou $merge . Se a definição de visualização incluir estágios de pipeline aninhados, como $lookup ou $facet, essa restrição também se aplicará a esses pipelines aninhados.
    Para saber mais sobre visualizações, consulte:
    - Visualizações
    - db.createView
  - associado ao banco de dados, coleção ou visualização para removê-la.
Observação
As query de amostra que você pode executar mais tarde neste tutorial utilizam os nomes Database0 para o nome do reconhecimento de data center virtual e Collection0 para o nome da collection virtual. Se você modificar os nomes aqui, certifique-se de modificar os nomes nas query de exemplo também antes de executá-los.
Arraste e solte o Data Lake Dataset para mapear com a collection.
Exemplo
Se você estiver criando uma Instância do Banco de Dados Federado para o conjunto de dados do Atlas Data Lake criado para os dados de amostra usando os exemplos em Criar um Pipeline do Atlas Data Lake - Visualização:
1. Em Datasets, selecione Ingestion Pipeline no menu suspenso se ainda não estiver selecionado.
2. Na seção Data Lake Dataset , arraste o conjunto de dados chamado sample_mflix.movies e solte-o na coleção.
Corresponde à configuração JSON do databases.[n].collections.[n].dataSources.

Defina seu conjunto de dados como um armazenamento de dados em sua configuração de armazenamento de Instância do Banco de Dados Federado.

Edite as definições de configuração JSON mostradas na interface do usuário para stores. Sua configuração de configuração do stores deve ser semelhante ao seguinte:

{
  "stores": [
    {
      "name": "<store-name>",
      "provider": "<cloud-storage-provider-name>",
      "region": "<cloud-storage-provider-region>"
    }
  ]
}

Para saber mais sobre essas configurações, consulte Configuração de armazenamento para conjuntos de Atlas Data Lake .

Exemplo

Se você estiver criando uma Instância de Banco de Dados Federado para o pipeline Atlas Data Lake que você criou para os dados de exemplo utilizando os exemplos em Criar um Atlas Data Lake Pipeline - Visualização, substitua o stores nas definições de configuração JSON mostradas na UI pelo seguinte:

{
  "stores": [
    {
      "name": "dls-store-us-east-1",
      "provider": "dls:aws",
      "region": "US_EAST_1"
    }
  ]
}

Defina bancos de dados virtuais, collections e visualizações para o seu conjunto de dados na configuração de armazenamento do Atlas Data Federation .

{
  "databases": [
    {
      "name": "<database-name>",
      "collections": [
        {
          "name": "<collection-name>",
          "dataSources": [
            {
              "storeName": "<store-name>",
              "datasetName": "<snapshot-name>"
            }
          ]
        }
      ],
      "views": []
    }
  ]
}

Para saber mais sobre essas configurações, consulte Configuração de armazenamento para conjuntos de Atlas Data Lake .

Exemplo

Se você estiver criando uma Instância do Banco de Dados Federado para o conjunto de dados do Atlas Data Lake que você criou para os dados de amostra utilizando os exemplos em Criar um Pipeline do Atlas Data Lake - Visualização, substitua o databases nas definições de configuração JSON mostradas na UI pelo seguinte:

{
  "databases": [
    {
      "name": "Database0",
      "collections": [
        {
          "name": "Collection0",
          "dataSources": [
            {
              "storeName": "dls-store-us-east-1",
              "datasetName": "v1$atlas$snapshot$dlsTest$sample_mflix$movies$$.<snapshot-id>"
            }
          ]
        }
      ],
      "views": []
    }
  ]
}

Clique Save em para criar a Instância do Banco de Dados Federado com bancos de dados virtuais, collections e exibições mapeadas para seu conjunto de dados do Data Lake.

Próximos passos

Agora que você criou uma Instância de banco de dados federado para seu conjunto de dados do Data Lake, vá para Conectar-se à sua instância de banco de dados federado - Visualização.

Voltar

Etapa 1: criar um pipeline para a ingestão de dados

Etapa 3: conectar-se à instância do banco de dados federado

Pré-requisitos

Procedimento

Faça login no MongoDB Atlas.

Clique em Create Federated Database.

Selecione o método de configuração.

Crie reconhecimento de data center virtuais, collection e exibições e mapeie-os para seu conjunto de dados do ingestão de dados.

Observação

Observação

Exemplo

Exemplo

Exemplo

Clique Save em para criar a Instância do Banco de Dados Federado com bancos de dados virtuais, collections e exibições mapeadas para seu conjunto de dados do Data Lake.

Próximos passos