Menu Docs

Página inicial do DocsVisualizar & analisar dadosMongoDB Atlas Data Lake

Atlas Data Lake

Nesta página

  • Sobre o Atlas Data Lake
  • Amostras de usos
  • Regiões do Atlas Data Lake
  • Cobrança

O MongoDB Atlas Data Lake é agora um serviço de armazenamento de objetos otimizado para análise para dados extraídos. O Atlas Data Lake oferece um serviço de armazenamento analítico otimizado para dados planos ou aninhados com desempenho de consulta de baixa latência.

O Atlas Data Lake requer um cluster Atlas habilitado para backup M10 ou superior com trabalhos de backup na nuvem executados em uma cadência especificada. Para saber mais sobre backups na nuvem, consulte Fazer backup de seu sistema de banco de dados.

O Atlas Data Lake oferece suporte a snapshots de coleta de clusters do Atlas como fonte de dados para dados extraídos. O Atlas Data Lake ingere automaticamente os dados dos snapshots, particiona e armazena os dados em um formato otimizado para análise. Ele não suporta a criação de pipelines para visualizações.

O Atlas Data Lake armazena dados em um formato orientado a análise baseado em padrões de open source com suporte para dados polimórficos. Os dados são totalmente gerenciados, indexados em nível de partição e equilibrados à medida que os dados crescem. O Atlas Data Lake otimiza a extração de dados para queries de tipo analítico. Quando o Atlas Data Lake extrai novos dados, ele reequilibra os arquivos existentes para garantir um desempenho consistente e minimizar a verificação de dados.

O Atlas Data Lake armazena dados em um formato que melhor se adapta à sua estrutura para permitir consultas rápidas de pontos e consultas agregadas. Para consultas pontuais, o formato de armazenamento do Atlas Data Lake melhora o desempenho ao encontrar partições mais rapidamente. As consultas do tipo agregado examinam apenas a coluna necessária para fornecer resultados. Além disso, os índices de partição do Atlas Data Lake melhoram o desempenho para consultas agregadas, retornando resultados diretamente do índice de partição sem a necessidade de verificar os arquivos subjacentes.

Você pode utilizar o Atlas Data Lake para:

  • Isolar os volumes de trabalho analíticos do cluster operacional.

  • Fornecer uma visão consistente dos dados do cluster a partir de um snapshot para agregações de longa duração usando $out.

  • Faça queries e compare versões dos dados do seu cluster em diferentes momentos.

O Atlas Data Lake fornece armazenamento otimizado nas seguintes regiões da AWS:

Regiões do Data Lake
Regiões da AWS
Virgínia, EUA
us-east-1
Oregon, EUA
us-west-2
São Paulo, Brasil
sa-east-1
Irlanda
eu-west-1
Londres, Inglaterra
eu-west-2
Frankfurt, Alemanha
eu-central-1
Mumbai, Índia
ap-south-1
Cingapura
ap-southeast-1
Sydney, Austrália
ap-southeast-2

O Atlas Data Lake seleciona automaticamente a região mais próxima do seu cluster do Atlas para armazenar dados ingeridos.

Você incorre em cobranças do Atlas Data Lake por GB por mês com base na região do AWS onde os dados ingeridos estão armazenados. Você incorre nos custos do Atlas Data Lake para os seguintes itens:

  • Ingestão de dados de sua fonte de dados

  • Armazenar no armazenamento de objetos na nuvem

O Atlas Data Lake cobra os recursos utilizados para extrair, carregar e transferir dados. As cobranças do Atlas Data Lake para as operações de exportação de snapshots são baseadas no seguinte:

  • Custo por GB para extração de snapshot

  • Custo por hora no servidor AWS para transferência de exportação de snapshot

  • Custo por GB por hora para armazenamento de restauração de exportação xde snapshot

  • Custo por IOPS por hora para IOPS de armazenamento de exportação de snapshot

As cobranças do Atlas Data Lake pelo armazenamento e acesso aos dados armazenados são baseadas no seguinte:

  • Custo por GB por dia

  • Custo para cada mil solicitações de acesso de armazenamento ao consultar conjuntos de dados do Data Lake utilizando o Atlas Data Federation. Cada pedido de acesso corresponde a uma partição de dados de um conjunto de dados Data Lake que o Atlas Data Federation procura processar para uma consulta.

    Observação

    Agora você pode definir limites na quantidade de dados que o Atlas Data Federation processa para suas consultas controlarem os custos. Para saber mais, consulte Gerenciar Limites de Consulta do Atlas Data Federation.

Para saber mais, consulte a página de preços do Atlas.

Introdução ao Data Lake →