Distribua uma instância de banco de dados federado
Nesta página
Esta página descreve como implantar uma instância do banco de dados federado para acessar dados em um armazenamento de dadosHTTP do .
Acesso necessário
Para implantar uma instância do banco de dados federado, você deve ter acesso do Project Owner
ao projeto. Os usuários com acesso Organization Owner
devem se adicionar como Project Owner
ao projeto antes de implantar uma instância do banco de dados federado.
Pré-requisitos
Antes de começar, você precisará:
Crie uma conta do MongoDB Atlas , se ainda não tiver uma.
Formate seu armazenamento de dados usando um dos formatos de dados suportados.
Observação
Se o formato do arquivo for
CSV
ouTSV
, você deverá incluir uma linha de cabeçalho nos dados. Consulte CSV e TSV para obter mais informações.Torne seu armazenamento de dados acessível pela Internet pública.
Importante
Se o seu armazenamento de dados HTTP não for acessível por HTTPS, você deverá utilizar o JSON Editor para configurar seu armazenamento de dados. Na configuração JSON , você deve definir a configuração
stores.[n].allowInsecure
comotrue
.O Atlas Data Federation não suporta URL s de armazenamento de dados HTTP que exijam autenticação.
Procedimento
Para criar um novo reconhecimento de data center Data Federation utilizando o Atlas CLI, execute o seguinte comando:
atlas dataFederation create <name> [options]
Para saber mais sobre a sintaxe e os parâmetros do comando, consulte a documentação do Atlas CLI para criar o Atlas dataFederation.
Selecione o provedor de nuvem onde o Atlas Data Federation processará suas queries em relação à sua instância do banco de dados federado.
Você pode selecionar Amazon Web Services Azure Google Cloud PlatformAmazon Web Services , Azure ou Google Cloud Platform . Após sua instância do banco de dados federado ser criada, você não poderá alterar o provedor de nuvem onde o Atlas Data Federation processa suas queries.
Especifique seu armazenamento de dados.
Selecione o conjunto de dados para sua instância do banco de dados federado na seção Data Sources .
Clique em Add Data Sources para selecionar seu armazenamento de dados.
Especifique seu armazenamento de dados.
Escolha HTTP(S) para configurar uma instância do banco de dados federado para dados em URL s HTTP e HTTPS acessíveis publicamente.
Corresponde à configuração
stores.[n].provider
JSON.Insira um nome para seu armazenamento de dados HTTP no campo HTTP(S) Store Name .
Observação
O nome do armazenamento de dados deve ser exclusivo dentro da instância do banco de dados federado.
Corresponde à configuração
stores.[n].name
JSON.Insira a URL acessível publicamente do arquivo onde os dados são armazenados.
O Atlas Data Federation oferece suporte aos tipos de arquivo JSON, BSON, CSV, TSV, Avro (gzipado ou descompactado), Parquet e ORC .
Dica
Clique em Use Sample URL para adicionar um armazenamento de dados HTTP de amostra.
Para cada armazenamento de dados HTTP adicional que você deseja adicionar, clique em Add Another URL e, em seguida, insira as URLs do armazenamento de dados HTTP .
Corresponde à configuração
stores.[n].urls
JSON.Clique em Next para configurar bancos de dados virtuais e collections.
Crie os bancos de dados, collections e visualizações virtuais e mapeie os bancos de dados, collections e visualizações para seu armazenamento de dados.
(Opcional) Clique em para o:
Banco de dados para editar o nome do banco de dados. Padrão é
VirtualDatabase[n]
.Corresponde à configuração JSON do
databases.[n].name
.Coleção para editar o nome da coleção. O padrão é
VirtualCollection[n]
.Corresponde à configuração JSON do
databases.[n].collections.[n].name
.Visualizar para editar o nome da visualização.
Você pode clicar em:
Add Database para adicionar bancos de dados e coleções.
associado ao banco de dados para adicionar coleções ao banco de dados.
associado à collection para adicionar visualizações na collection. Para criar uma visualização, você deve especificar:
O nome da visualização.
O pipeline a ser aplicado à visualização.
O pipeline de definição de visualização não pode incluir o estágio
$out
ou$merge
. Se a definição de visualização incluir estágios de pipeline aninhados, como$lookup
ou$facet
, essa restrição também se aplicará a esses pipelines aninhados.
Para saber mais sobre visualizações, consulte:
associado ao banco de dados, coleção ou visualização para removê-la.
Selecione HTTP no menu suspenso da seção Data Sources .
Arraste e solte o armazenamento de dados para mapear com a collection.
Corresponde à configuração JSON do
databases.[n].collections.[n].dataSources
.
Sua configuração para um armazenamento de dados HTTP deve ser semelhante a esta:
1 { 2 "stores" : [ 3 { 4 "name" : "<string>", 5 "provider": "<string>", 6 "defaultFormat" : "<string>", 7 "allowInsecure": <boolean>, 8 "urls": ["<string>"] 9 } 10 ], 11 "databases" : [ 12 { 13 "name" : "<string>", 14 "collections" : [ 15 { 16 "name" : "<string>", 17 "dataSources" : [ 18 { 19 "storeName" : "<string>", 20 "allowInsecure" : <boolean>, 21 "urls" : ["<string>"], 22 "defaultFormat" : "<string>", 23 "provenanceFieldName": "<string>" 24 } 25 ] 26 } 27 ], 28 "views" : [ 29 { 30 "name" : "<string>", 31 "source" : "<string>", 32 "pipeline" : "<string>" 33 } 34 ] 35 } 36 ] 37 }
Para obter mais informações sobre as definições de configuração, consulte URL HTTP .
Defina seu armazenamento de dados HTTP .
Edite as definições de configuração JSON mostradas na interface do usuário para
stores
. Sua configuração de configuração dostores
deve ser semelhante ao seguinte:"stores" : [ { "name" : "<string>", "provider" : "<string>", "allowInsecure": <boolean>, "urls" : ["<string>"], "defaultFormat" : "<string>" } ] Para saber mais sobre essas definições de configuração, consulte
stores
.Defina seus bancos de dados virtuais, collections e visualizações de instância do banco de dados federado .
Edite as definições de configuração JSON mostradas na interface do usuário para
databases
. Sua configuração de configuração dodatabases
deve ser semelhante ao seguinte:"databases" : [ { "name" : "<string>", "collections" : [ { "name" : "<string>", "dataSources" : [ { "storeName" : "<string>", "allowInsecure" : <boolean>, "urls" : ["<string>"], "defaultFormat" : "<string>", "provenanceFieldName": "<string>" } ] } ] } ] Para saber mais sobre essas definições de configuração, consulte
databases
.