EventoObtenha 50% de desconto no seu ingresso para MongoDB.local Londres em outubro 2. Use o código WEB50Saiba mais >>
Desenvolvedor MongoDB
Central de desenvolvedor do MongoDBchevron-right
Produtoschevron-right
Atlaschevron-right

Conjuntos de dados de amostra do MongoDB Atlas

Eoin Brazil8 min read • Published Jan 19, 2022 • Updated May 31, 2022
Atlas
Ícone do FacebookÍcone do Twitterícone do linkedin
Avalie esse Artigo
star-empty
star-empty
star-empty
star-empty
star-empty
Você sabia que o MongoDB Atlas fornece um conjunto completo de dados de exemplo para ajudá-lo a aprender mais rapidamente? O recurso Carregar dados de amostra permite a você carregar oito conjuntos de dados em seu banco de dados para explorar. Você pode usar isso com a camada grátis do MongoDB Atlas M0 para experimentar os recursos do MongoDB Atlas e do MongoDB. Os dados de amostra ajudam você a experimentar recursos como indexação; realização de query, incluindo geoespacial; e agregações, bem como o uso de ferramentas do MongoDB, como MongoDB Charts e MongoDB Compass.
No restante desta publicação, veremos por que ele foi criado, como primeiro carregar os dados de amostra e, em seguida, descreveremos o que os conjuntos de dados contêm. Também abordaremos como baixar esses conjuntos de dados para usá-los em sua própria máquina local.

Sumário

Por que criamos este conjunto de dados de amostra?

Antes de aprendermos a carregar os dados de amostra, vale a pena primeiro destacar por que criamos o recurso. Construímos esse recurso porque, muitas vezes, as pessoas criavam um novo cluster do Atlas vazio e, depois, tinham que esperar até que escrevessem seu aplicativo ou importassem dados para ele antes de poderem aprender e explorar a plataforma. Os dados de amostra do Atlas foram a solução. Eles removem esse bloqueio e permitem que você tenha uma noção de como o MongoDB funciona com diferentes tipos de dados.

Carregando o conjunto de dados de amostra em seu cluster do Atlas

Carregar os dados de amostra requer um cluster do Atlas existente e três etapas.
  • No painel de navegação esquerdo no Atlas, clique em Clusters e escolha em qual cluster você deseja carregar os dados.
  • Para esse cluster, clique no botão Reticências (...).
  • Em seguida, clique no botão "Carregar conjunto de dados de amostra".
  • Clique no botão com o nome correspondente, "Carregar conjunto de dados de amostra".
Esse processo levará alguns minutos para ser concluído, então, vamos ver exatamente que tipo de dados vamos carregar. Depois que o processo terminar, você verá um banner em seu cluster do Atlas semelhante a esta imagem abaixo.

Um detalhamento dos dados de amostra do Atlas

Os conjuntos de dados de amostra do Atlas são compostos por oito bancos de dados e suas coleções associadas. Cada conjunto de dados individual é documentado para ilustrar o esquema, as coleções, os índices e um documento de cada coleção.

Amostra do conjunto de dados de listagens AirBnB

Esse conjunto de dados consiste em uma única coleção de avaliações e listagens do AirBnB. Há índices nos campos property type, room type, bed, name e location, bem como no _id dos documentos.
Os dados são um subconjunto aleatório do conjunto de dados AirBnB original disponível publicamente. Abrange várias cidades diferentes ao redor do mundo. Este conjunto de dados é utilizado extensivamente nos cursos da MongoDB University.

Exemplo de conjunto de dados analíticos

Esse conjunto de dados consiste em três coleções de dados de serviços financeiros gerados aleatoriamente. Não há índices adicionais além do índice _id em cada coleção. As coleções representam contas, transações e clientes.
A coleção de transações usa o padrão bucket para manter um conjunto de transações por um período. Ela foi criada para o treinamento particular do MongoDB, especificamente para o curso do MongoDB para análise de dados.
As vantagens de usar esse padrão são a redução do tamanho do índice em comparação com o armazenamento de cada transação em um único documento. Isso pode simplificar as queries e permite o uso de dados pré-agregados em nossos documentos.
Você pode encontrar mais detalhes na página de documentação de análise de amostra.

Exemplo de conjunto de dados geoespaciais

Esse conjunto de dados consiste em uma única coleção com informações sobre naufrágios. Ele tem um índice adicional no campo (GeoJSON) coordinates. Esse índice é um índice Geospatial 2dsphere. Esse conjunto de dados foi criado para ajudar a explorar a possibilidade de queries geoespaciais no MongoDB.
A imagem abaixo foi criada no MongoDB Charts e mostra todos os naufrágios na costa leste da América do Norte.
Você pode encontrar mais detalhes na página Documentação geoespacial de exemplo.

Amostra de conjunto de dados mflix

Esse conjunto de dados consiste em cinco coleções com informações sobre filmes, cinemas, metadados de filmes e avaliações de filmes de usuários e suas classificações para filmes específicos. Os dados são um subconjunto do conjunto de dados IMDB. Existem três índices adicionais além de _id: na coleção de sessões no campo user_id, na coleção de cinemas no campo location.geo e na coleção de usuários no campo email. Você pode ver esse conjunto de dados usado neste tutorial do MongoDB Charts.
O site Atlas Search Movies usa esses dados e o Atlas Search do MongoDB para fornecer um catálogo de filmes pesquisável.
Esse conjunto de dados é a base do nosso tutorial do Atlas Search.

Conjunto de Dados de Restaurantes de Amostra

Esse conjunto de dados consiste em duas coleções com informações sobre restaurantes e bairros de Nova York. Não há índices adicionais. Esse conjunto de dados é a base do nosso tutorial geoespacial. O documento do restaurante contém apenas o local e o nome de um determinado restaurante.
Para usar as coleções para busca geográfica, precisamos adicionar um índice, especificamente um índice 2dsphere. Podemos adicionar esse índice e, em seguida, pesquisar todos os restaurantes em um raio de um quilômetro de um determinado local, com os resultados sendo classificados dos mais próximos aos mais distantes. O código abaixo cria o índice e, em seguida, adiciona uma variável auxiliar para representar 1 km, que nossa consulta usa com os critérios $nearSphere para retornar a lista de restaurantes a menos de 1km desse local.
Você pode encontrar mais detalhes na página Documentação de restaurantes de exemplo.

Amostra de conjunto de dados de loja de suprimentos

Este conjunto de dados consiste em uma única coleção com informações sobre dados simulados de vendas de uma hipotética empresa de materiais de escritório. Não há índices adicionais. Este é o segundo conjunto de dados usado nos tutoriais do MongoDB Chart.
A coleção de vendas usa o padrão de referência estendida para conter os itens vendidos e seus detalhes, bem como informações sobre o cliente que comprou esses itens. Esse padrão inclui campos acessados com frequência no documento principal para melhorar o desempenho ao custo da duplicação adicional de dados.

Amostra de Conjunto de Dados de Treinamento

Este conjunto de dados consiste em nove coleções sem índices adicionais. Ele representa uma seleção de dados realistas e é usado nos cursos de treinamento privados do MongoDB.
Ele inclui várias fontes de dados públicas e conhecidas, como OpenFlights, OpenData de Nova York e Citibike Data de Nova York.
A coleção de rotas usa o padrão Extended Reference para armazenar dados de OpenFlights em rotas aéreas entre aeroportos. Ele faz referência às informações da companhia aérea no documento airline, que contém detalhes sobre o avião específico na rota. Esse é outro exemplo de como melhorar o desempenho ao custo de uma pequena duplicação de dados em campos que provavelmente serão acessados com frequência .
Você pode encontrar mais detalhes na página de amostra de documentação de treinamento.

Amostra de conjunto de dados meteorológicos

Esse conjunto de dados consiste em uma única coleção sem índices adicionais. Ele representa relatórios meteorológicos detalhados de locais em todo o mundo. Ele contém dados geoespaciais sobre os locais na forma de legacy coordinate pairs.
Você pode encontrar mais detalhes na página Documentação de clima de exemplo.
Se você tiver ideias ou sugestões para novos conjuntos de dados, estamos sempre interessados. Informe-nos no site da comunidade de desenvolvedores.

Baixando o conjunto de dados para uso em sua máquina local

Também é possível baixar e explorar esses conjuntos de dados em seu próprio computador local. Você pode baixar o conjunto de dados de amostra completo por meio do comando wget:
Observação: você também pode usar o comando curl:
Você deve verificar se está executando uma instância mongod local ou deve iniciar uma nova instância mongod neste ponto. Este mongod será utilizado em conjunto com mongorestore para descompactar e hospedar uma cópia local do conjunto de dados de amostra. Você pode encontrar mais detalhes sobre como iniciar instâncias do mongod nesta página de documentação.
Esta seção pressupõe que você esteja se conectando a uma configuração relativamente simples, com um banco de dados de autenticação padrão e alguma configuração de autenticação. (Você deve sempre criar alguns usuários para autenticação):
Se você não fornecer nenhum detalhe de conexão ao mongorestore, ele tentará se conectar ao MongoDB em sua máquina local, na porta 27017 (que é o padrão do MongoDB). Isso é o mesmo que fornecer --host localhost:27017.
Você pode usar uma variedade de ferramentas para exibir seus documentos. Você pode usar o MongoDB Compass, o CLI ou o plug-in MongoDB Visual Studio Code (VSCode) para interagir com os documento em suas coleções. Você pode descobrir como usar o MongoDB Playground para VSCode e integrar o MongoDB a um ambiente de código do Visual Studio.
Se você achar que os dados de amostra são úteis para a criação, fale conosco nos fóruns da comunidade!

Embrulhar

Esses conjuntos de dados oferecem uma ampla seleção de dados que você pode usar para explorar os recursos do MongoDB e criar um protótipo do seu próximo projeto sem ter que se preocupar com a localização dos dados.
Confira a documentação sobre como Carregar dados de amostra para saber mais sobre esses conjuntos de dados e carregue-os em seu cluster do Atlas hoje mesmo para começar a explorá-los!
Para saber mais sobre padrões de esquema e MongoDB, confira nossa série de blogs Criando com padrões e o curso gratuito da MongoDB University M320: Modelagem de dados para aprimorar suas habilidades de projeto de esquema.
Se tiver dúvidas, acesse o site da nossa comunidade de desenvolvedores, no qual os engenheiros e a comunidade do MongoDB ajudarão você a desenvolver sua próxima grande ideia com o MongoDB.

Ícone do FacebookÍcone do Twitterícone do linkedin
Avalie esse Artigo
star-empty
star-empty
star-empty
star-empty
star-empty
Relacionado
Artigo

Consultar lista de preços do MongoDB Atlas com Atlas Data Federation


Jun 15, 2023 | 4 min read
Artigo

Como habilitar o teste local e automático de recursos baseados na pesquisa do Atlas


Jun 12, 2024 | 8 min read
Início rápido

Como conectar o MongoDB Atlas ao Vercel usando a nova integração


Aug 05, 2024 | 4 min read
Vídeo

A cena do Atlas Search: Temporada 1


Sep 11, 2024 | 2 min
Sumário
  • Sumário
  • Por que criamos este conjunto de dados de amostra?
  • Carregando o conjunto de dados de amostra em seu cluster do Atlas
  • Um detalhamento dos dados de amostra do Atlas
  • Embrulhar