Menu Docs

Amostra de Conjunto de Dados de Treinamento

O banco de dados do sample_training contém um conjunto de dados realistas utilizados em Ofertas de Treinamento Privadas do MongoDB. Este conjunto de dados é baseado em fontes de dados públicas disponíveis, como:

Esses conjuntos de dados realistas são usados por nossos alunos para explorar a funcionalidade do MongoDB em nossos laboratórios e exercícios de treinamento particulares.

Para saber como carregar os dados de amostra fornecidos pelo Atlas em seu cluster, consulte Carregar Dados de Amostra.

O banco de dados do sample_training contém as seguintes coleções:

Nome da collection
Descrição

Contém uma lista de informações da empresa Crunchbase Data .

Contém informações sobre a nota do aluno em uma determinada turma, incluindo pontuações em diferentes avaliações.

Contém uma lista de inspeções de negócios da cidade de Nova York, incluindo se a empresa falhou ou passou na inspeção.

Contém discursos aleatórios do Senado dos EUA organizados como postagens de blog com comentários gerados aleatoriamente.

Contém informações de rotas de companhias aéreas, com aeroportos de origem e destino, a companhia aérea de serviço e o tipo de avião. Esta coleção é usada em laboratórios que exploram o estágio de agregação $graphLookup .

Contém dados de viagens do New York City Citibike Data . Esses dados são úteis para explorar o estágio de agregação $graphLookup e mostrar Consultas Geoespaciais .

Contém dados de código postal das cidades gerais dos Estados Unidos.

Esta collection contém informações sobre empresas listadas na Crunchbase. Ela contém uma variedade de informações, como o website da empresa e/ou websites de blogs sobre a empresa, rodadas de financiamento e pessoas conhecidas associadas à empresa.

Esta coleção contém os seguintes índices:

Nome
Index
Descrição

_id_

{ "_id": 1 }

Índice de chave primária no campo _id.

{
"_id": {
"$oid": "52cdef7c4bab8bd675298291"
},
"acquisition": null,
"acquisitions": [],
"alias_list": null,
"blog_feed_url": "http://mobiance.wordpress.com/feed/",
"blog_url": "http://mobiance.wordpress.com/",
"category_code": "web",
"competitions": [],
"created_at": "Tue Feb 12 17:31:58 UTC 2008",
"crunchbase_url": "http://www.crunchbase.com/company/mobiance",
"deadpooled_day": null,
"deadpooled_month": null,
"deadpooled_url": null,
"deadpooled_year": null,
"description": null,
"email_address": "info@mobiance.com",
"external_links": [],
"founded_day": {
"$numberInt": "1"
},
"founded_month": {
"$numberInt": "10"
},
"founded_year": {
"$numberInt": "2004"
},
"funding_rounds": [],
"homepage_url": "http://www.mobiance.com",
"image": {
"attribution": null,
"available_sizes": [
[
[
{
"$numberInt": "150"
},
{
"$numberInt": "43"
}
],
"assets/images/resized/0001/1859/11859v1-max-150x150.png"
],
[
[
{
"$numberInt": "208"
},
{
"$numberInt": "60"
}
],
"assets/images/resized/0001/1859/11859v1-max-250x250.png"
],
[
[
{
"$numberInt": "208"
},
{
"$numberInt": "60"
}
],
"assets/images/resized/0001/1859/11859v1-max-450x450.png"
]
]
},
"investments": [],
"ipo": null,
"milestones": [],
"name": "Mobiance",
"number_of_employees": {
"$numberInt": "5"
},
"offices": [
{
"address1": "BC-3, Atrium Business Center,",
"address2": "Coles Road, Frazer Town,",
"city": "Bangalore",
"country_code": "IND",
"description": null,
"latitude": null,
"longitude": null,
"state_code": null,
"zip_code": "560005"
}
],
"overview": "<p>Mobiance provides the technology to track cell phones ...",
"partners": [],
"permalink": "mobiance",
"phone_number": "+91-80- 41264756",
"products": [],
"providerships": [],
"relationships": [
{
"is_past": true,
"person": {
"first_name": "Ritesh",
"last_name": "Ambastha",
"permalink": "ritesh-ambastha"
},
"title": "Product Manager"
}
],
"screenshots": [],
"tag_list": null,
"total_money_raised": "$0",
"twitter_username": null,
"updated_at": "Thu Dec 01 07:37:10 UTC 2011",
"video_embeds": []
}

Esta coleção gerou aleatoriamente as notas de alunos. Cada documento contém um class_id que identifica a classe e um student_id que identifica o aluno. Todas as pontuações do exame de aula do aluno são armazenadas na array scores, que contém subdocumentos com dois campos representando o tipo de avaliação e a pontuação do aluno para essa avaliação.

Esta coleção contém os seguintes índices:

Nome
Index
Descrição

_id_

{ "_id": 1 }

Índice de chave primária no campo _id.

{
"_id": {
"$oid": "56d5f7eb604eb380b0d8d8fa"
},
"class_id": {
"$numberDouble": "173"
},
"scores": [
{
"score": {
"$numberDouble": "19.81430597438296"
},
"type": "exam"
},
{
"score": {
"$numberDouble": "16.851404299968642"
},
"type": "quiz"
},
{
"score": {
"$numberDouble": "60.108751761488186"
},
"type": "homework"
},
{
"score": {
"$numberDouble": "22.886167083915776"
},
"type": "homework"
}
],
"student_id": {
"$numberDouble": "4"
}
}

A coleção inspections foi retirada do conjunto de dados NYC OpenData. Cada documento inspections contém informações sobre:

  • O nome, setor e endereço da empresa inspecionados,

  • ID de inspeção, resultado, data e número do certificado.

Esta coleção contém os seguintes índices:

Nome
Index
Descrição

_id_

{ "_id": 1 }

Índice de chave primária no campo _id.

{
"_id": {
"$oid": "56d61033a378eccde8a8357e"
},
"address": {
"city": "LAWRENCE",
"number": 1,
"street": "BAY BLVD",
"zip": 11559
},
"business_name": "SPRAGUE OPERATING RESOURCES LLC.",
"certificate_number": 3019422,
"date": "Mar 3 2015",
"id": "11247-2015-ENFO",
"result": "Fail",
"sector": "Fuel Oil Dealer - 814"
}

A collection posts é um conjunto de blog posts gerados aleatoriamente, criados usando os discursos do Senado dos EUA como semente para o campo do corpo do documento. Em cada documento você encontrará:

  • Informações sobre os posts do blog, como corpo do texto, autor, permalink, data e título,

  • Lista de tags gerada aleatoriamente,

  • Lista aleatória de subdocumentos de comentários.

Esta coleção contém os seguintes índices:

Nome
Index
Descrição

_id_

{ "_id": 1 }

Índice de chave primária no campo _id.

{
"_id": {
"$oid": "50ab0f8bbcf1bfe2536dc3f9"
},
"author": "machine",
"body": "Amendment I\n<p>Congress shall make no law respecting ... ",
"comments": [
{
"author": "Santiago Dollins",
"body": "Lorem ipsum dolor sit amet, consectetur adipisicing...",
"email": "HvizfYVx@pKvLaagH.com"
},
{
"author": "Jaclyn Morado",
"body": "Lorem ipsum dolor sit amet, consectetur adipisicing...",
"email": "WpOUCpdD@hccdxJvT.com"
}
...
],
"date": {
"$date": {
"$numberLong": "1332804016000"
}
},
"permalink": "aRjNnLZkJkTyspAIoRGe",
"tags": [
"watchmaker",
"santa",
"xylophone",
"math",
"handsaw",
"dream",
"undershirt",
"dolphin",
"tanker",
"action"
],
"title": "Bill of Rights"
}

Os dados da coleção routes foram obtidos a partir dos dados do Open Flights . Os documentos desta coleção contêm informações sobre rotas aéreas entre aeroportos.

Cada documento contém informações sobre:

  • Dados da companhia aérea no subdocumento contendo o nome, o nome alternativo, o identificador exclusivo e o código da companhia aérea IATA,

  • Os aeroportos de origem e destino, identificados por seu código IATA,

  • Codeshare de rota e o número de paradas.

Esta coleção contém os seguintes índices:

Nome
Index
Descrição

_id_

{ "_id": 1 }

Índice de chave primária no campo _id.

{
"_id": {
"$oid": "56e9b39b732b6122f877fa5c"
},
"airline": {
"alias": "2G",
"iata": "CRG",
"id": 1654,
"name": "Cargoitalia"
},
"airplane": "A81",
"codeshare": "",
"dst_airport": "OVB",
"src_airport": "BTK",
"stops": 0
}

A coleção trips contém dados de passeios de bicicleta do serviço Citibike da cidade de Nova York. Os documentos são compostos de:

  • Identificador exclusivo da bicicleta,

  • Hora e data de início e parada da viagem,

  • Nomes de estações iniciais e finais da viagem e localização geoespacial,

  • Informações do usuário, como gênero, ano de nascimento e tipo de serviço (Consumidor ou Assinante).

Esta coleção contém os seguintes índices:

Nome
Index
Descrição

_id_

{ "_id": 1 }

Índice de chave primária no campo _id.

{
"_id": {
"$oid": "572bb8222b288919b68abf82"
},
"bikeid": 14785,
"birth year": 1977,
"end station id": 433,
"end station location": {
"coordinates": [
-73.98057249,
40.72955361
],
"type": "Point"
},
"end station name": "E 13 St & Avenue A",
"gender": 1,
"start station id": 518,
"start station location": {
"coordinates": [
-73.9734419,
40.74780373
],
"type": "Point"
},
"start station name": "E 39 St & 2 Ave",
"start time": {
"$date": {
"$numberLong": "1332804016000"
}
},
"stop time": {
"$date": {
"$numberLong": "1352114016000"
}
},
"tripduration": 812,
"usertype": "Subscriber"
}

A coleção zips contém informações de cidades dos EUA e seus códigos postais/ceps de área. Os documentos contêm informações sobre o nome da cidade, CEP da área, coordenadas geográficas do centro da cidade (latitude e longitude), estado e população.

Este conjunto de dados é usado para explorar a criação e queries de 2d Index.

Esta coleção contém os seguintes índices:

Nome
Index
Descrição

_id_

{ "_id": 1 }

Índice de chave primária no campo _id.

{
"_id": {
"$oid": "5c8eccc1caa187d17ca6ed29"
},
"city": "CLEVELAND",
"loc": {
"x": 86.559355,
"y": 33.992106
},
"pop": 2369,
"state": "AL",
"zip": "35049"
}