Menu Docs
Página inicial do Docs
/ /
MongoDB Atlas Data Lake
/

Configurar uma instância de banco de dados federado para seu conjunto de dados - Visualização

Nesta página

  • Pré-requisitos
  • Procedimento
  • Próximos passos

Esta página orienta você nas etapas de criação de uma instância do banco de dados federado para seu conjunto de dados de ingestão de dados.

Antes de começar, você deve ter o seguinte:

1
2
  1. Se ainda não estiver exibido, selecione a organização que contém seu projeto no menu Organizations na barra de navegação.

  2. Se ainda não estiver exibido, selecione seu projeto no menu Projects na barra de navegação.

  3. Na barra lateral, clique em Data Federation sob o título Services.

3
4
  • Para uma experiência guiada, habilite Visual Editor. (Padrão)

  • Para editar o JSON bruto, desabilite o Visual Editor.

5

Siga as etapas na guia abaixo para obter sua visualização preferida do Editor na interface do usuário.

  1. (Opcional) Clique em para o:

    • Federated Database Instance para especificar um nome para a instância do banco de dados federado. Padrão é FederatedDatabaseInstance[n].

    • Banco de dados para editar o nome do banco de dados. Padrão é Database[n].

      Corresponde à configuração JSON do databases.[n].name.

    • Coleção para editar o nome da coleção. O padrão é Collection[n].

      Corresponde à configuração JSON do databases.[n].collections.name.

    • Visualizar para editar o nome da visualização.

    Você pode clicar em:

    • Add Database para adicionar bancos de dados e coleções.

    • associado ao banco de dados para adicionar coleções ao banco de dados.

    • associado à collection para adicionar visualizações na collection. Para criar uma visualização, você deve especificar:

      • O nome da visualização.

      • O pipeline a ser aplicado à visualização.

        Observação

        O pipeline de definição de visualização não pode incluir o estágio $out ou $merge . Se a definição de visualização incluir estágios de pipeline aninhados, como $lookup ou $facet, essa restrição também se aplicará a esses pipelines aninhados.

        Para saber mais sobre visualizações, consulte:

      • associado ao banco de dados, coleção ou visualização para removê-la.

    Observação

    As query de amostra que você pode executar mais tarde neste tutorial utilizam os nomes Database0 para o nome do reconhecimento de data center virtual e Collection0 para o nome da collection virtual. Se você modificar os nomes aqui, certifique-se de modificar os nomes nas query de exemplo também antes de executá-los.

  2. Arraste e solte o Data Lake Dataset para mapear com a collection.

    Exemplo

    Se você estiver criando uma Instância do Banco de Dados Federado para o conjunto de dados do Atlas Data Lake criado para os dados de amostra usando os exemplos em Criar um Pipeline do Atlas Data Lake - Visualização:

    1. Em Datasets, selecione Ingestion Pipeline no menu suspenso se ainda não estiver selecionado.

    2. Na seção Data Lake Dataset , arraste o conjunto de dados chamado sample_mflix.movies e solte-o na coleção.

    Corresponde à configuração JSON do databases.[n].collections.[n].dataSources.

  1. Defina seu conjunto de dados como um armazenamento de dados em sua configuração de armazenamento de Instância do Banco de Dados Federado.

    Edite as definições de configuração JSON mostradas na interface do usuário para stores. Sua configuração de configuração do stores deve ser semelhante ao seguinte:

    {
    "stores": [
    {
    "name": "<store-name>",
    "provider": "<cloud-storage-provider-name>",
    "region": "<cloud-storage-provider-region>"
    }
    ]
    }

    Para saber mais sobre essas configurações, consulte Configuração de armazenamento para conjuntos de Atlas Data Lake .

    Exemplo

    Se você estiver criando uma Instância de Banco de Dados Federado para o pipeline Atlas Data Lake que você criou para os dados de exemplo utilizando os exemplos em Criar um Atlas Data Lake Pipeline - Visualização, substitua o stores nas definições de configuração JSON mostradas na UI pelo seguinte:

    {
    "stores": [
    {
    "name": "dls-store-us-east-1",
    "provider": "dls:aws",
    "region": "US_EAST_1"
    }
    ]
    }
  2. Defina bancos de dados virtuais, collections e visualizações para o seu conjunto de dados na configuração de armazenamento do Atlas Data Federation .

    {
    "databases": [
    {
    "name": "<database-name>",
    "collections": [
    {
    "name": "<collection-name>",
    "dataSources": [
    {
    "storeName": "<store-name>",
    "datasetName": "<snapshot-name>"
    }
    ]
    }
    ],
    "views": []
    }
    ]
    }

    Para saber mais sobre essas configurações, consulte Configuração de armazenamento para conjuntos de Atlas Data Lake .

    Exemplo

    Se você estiver criando uma Instância do Banco de Dados Federado para o conjunto de dados do Atlas Data Lake que você criou para os dados de amostra utilizando os exemplos em Criar um Pipeline do Atlas Data Lake - Visualização, substitua o databases nas definições de configuração JSON mostradas na UI pelo seguinte:

    {
    "databases": [
    {
    "name": "Database0",
    "collections": [
    {
    "name": "Collection0",
    "dataSources": [
    {
    "storeName": "dls-store-us-east-1",
    "datasetName": "v1$atlas$snapshot$dlsTest$sample_mflix$movies$$.<snapshot-id>"
    }
    ]
    }
    ],
    "views": []
    }
    ]
    }
6

Agora que você criou uma Instância de banco de dados federado para seu conjunto de dados do Data Lake, vá para Conectar-se à sua instância de banco de dados federado - Visualização.

Voltar

Etapa 1: criar um pipeline para a ingestão de dados