Amostra de Conjunto de Dados de Treinamento
Nesta página
O banco de dados do sample_training
contém um conjunto de dados realistas utilizados em Ofertas de Treinamento Privadas do MongoDB. Este conjunto de dados é baseado em fontes de dados públicas disponíveis, como:
Esses conjuntos de dados realistas são usados por nossos alunos para explorar a funcionalidade do MongoDB em nossos laboratórios e exercícios de treinamento particulares.
Para saber como carregar os dados de amostra fornecidos pelo Atlas em seu cluster, consulte Carregar Dados de Amostra.
Collections
O banco de dados do sample_training
contém as seguintes coleções:
Nome da collection | Descrição |
---|---|
Contém uma lista de informações da empresa Crunchbase Data . | |
Contém informações sobre a nota do aluno em uma determinada turma, incluindo pontuações em diferentes avaliações. | |
Contém uma lista de inspeções de negócios da cidade de Nova York, incluindo se a empresa falhou ou passou na inspeção. | |
Contém discursos aleatórios do Senado dos EUA organizados como postagens de blog com comentários gerados aleatoriamente. | |
Contém informações de rotas de companhias aéreas, com aeroportos de origem e destino, a companhia aérea de serviço e o tipo de avião. Esta coleção é usada em laboratórios que exploram o estágio de agregação $graphLookup . | |
Contém dados de viagens do New York City Citibike Data . Esses dados são úteis para explorar o estágio de agregação $graphLookup e mostrar Consultas Geoespaciais . | |
Contém dados de código postal das cidades gerais dos Estados Unidos. |
sample_training.companies
Esta collection contém informações sobre empresas listadas na Crunchbase. Ela contém uma variedade de informações, como o website da empresa e/ou websites de blogs sobre a empresa, rodadas de financiamento e pessoas conhecidas associadas à empresa.
Indexes
Esta coleção contém os seguintes índices:
Nome | Index | Descrição |
---|---|---|
|
| Índice de chave primária no campo |
Documento de amostra
{ "_id": { "$oid": "52cdef7c4bab8bd675298291" }, "acquisition": null, "acquisitions": [], "alias_list": null, "blog_feed_url": "http://mobiance.wordpress.com/feed/", "blog_url": "http://mobiance.wordpress.com/", "category_code": "web", "competitions": [], "created_at": "Tue Feb 12 17:31:58 UTC 2008", "crunchbase_url": "http://www.crunchbase.com/company/mobiance", "deadpooled_day": null, "deadpooled_month": null, "deadpooled_url": null, "deadpooled_year": null, "description": null, "email_address": "info@mobiance.com", "external_links": [], "founded_day": { "$numberInt": "1" }, "founded_month": { "$numberInt": "10" }, "founded_year": { "$numberInt": "2004" }, "funding_rounds": [], "homepage_url": "http://www.mobiance.com", "image": { "attribution": null, "available_sizes": [ [ [ { "$numberInt": "150" }, { "$numberInt": "43" } ], "assets/images/resized/0001/1859/11859v1-max-150x150.png" ], [ [ { "$numberInt": "208" }, { "$numberInt": "60" } ], "assets/images/resized/0001/1859/11859v1-max-250x250.png" ], [ [ { "$numberInt": "208" }, { "$numberInt": "60" } ], "assets/images/resized/0001/1859/11859v1-max-450x450.png" ] ] }, "investments": [], "ipo": null, "milestones": [], "name": "Mobiance", "number_of_employees": { "$numberInt": "5" }, "offices": [ { "address1": "BC-3, Atrium Business Center,", "address2": "Coles Road, Frazer Town,", "city": "Bangalore", "country_code": "IND", "description": null, "latitude": null, "longitude": null, "state_code": null, "zip_code": "560005" } ], "overview": "<p>Mobiance provides the technology to track cell phones ...", "partners": [], "permalink": "mobiance", "phone_number": "+91-80- 41264756", "products": [], "providerships": [], "relationships": [ { "is_past": true, "person": { "first_name": "Ritesh", "last_name": "Ambastha", "permalink": "ritesh-ambastha" }, "title": "Product Manager" } ], "screenshots": [], "tag_list": null, "total_money_raised": "$0", "twitter_username": null, "updated_at": "Thu Dec 01 07:37:10 UTC 2011", "video_embeds": [] }
sample_training.grades
Esta coleção gerou aleatoriamente as notas de alunos. Cada documento contém um class_id
que identifica a classe e um student_id
que identifica o aluno. Todas as pontuações do exame de aula do aluno são armazenadas na array scores
, que contém subdocumentos com dois campos representando o tipo de avaliação e a pontuação do aluno para essa avaliação.
Indexes
Esta coleção contém os seguintes índices:
Nome | Index | Descrição |
---|---|---|
|
| Índice de chave primária no campo |
Documento de amostra
{ "_id": { "$oid": "56d5f7eb604eb380b0d8d8fa" }, "class_id": { "$numberDouble": "173" }, "scores": [ { "score": { "$numberDouble": "19.81430597438296" }, "type": "exam" }, { "score": { "$numberDouble": "16.851404299968642" }, "type": "quiz" }, { "score": { "$numberDouble": "60.108751761488186" }, "type": "homework" }, { "score": { "$numberDouble": "22.886167083915776" }, "type": "homework" } ], "student_id": { "$numberDouble": "4" } }
sample_training.inspections
A coleção inspections
foi retirada do conjunto de dados NYC OpenData. Cada documento inspections
contém informações sobre:
O nome, setor e endereço da empresa inspecionados,
ID de inspeção, resultado, data e número do certificado.
Indexes
Esta coleção contém os seguintes índices:
Nome | Index | Descrição |
---|---|---|
|
| Índice de chave primária no campo |
Documento de amostra
{ "_id": { "$oid": "56d61033a378eccde8a8357e" }, "address": { "city": "LAWRENCE", "number": 1, "street": "BAY BLVD", "zip": 11559 }, "business_name": "SPRAGUE OPERATING RESOURCES LLC.", "certificate_number": 3019422, "date": "Mar 3 2015", "id": "11247-2015-ENFO", "result": "Fail", "sector": "Fuel Oil Dealer - 814" }
sample_airbnb.listingsAndReviews
A collection posts
é um conjunto de blog posts gerados aleatoriamente, criados usando os discursos do Senado dos EUA como semente para o campo do corpo do documento. Em cada documento você encontrará:
Informações sobre os posts do blog, como corpo do texto, autor, permalink, data e título,
Lista de tags gerada aleatoriamente,
Lista aleatória de subdocumentos de comentários.
Indexes
Esta coleção contém os seguintes índices:
Nome | Index | Descrição |
---|---|---|
|
| Índice de chave primária no campo |
Documento de amostra
{ "_id": { "$oid": "50ab0f8bbcf1bfe2536dc3f9" }, "author": "machine", "body": "Amendment I\n<p>Congress shall make no law respecting ... ", "comments": [ { "author": "Santiago Dollins", "body": "Lorem ipsum dolor sit amet, consectetur adipisicing...", "email": "HvizfYVx@pKvLaagH.com" }, { "author": "Jaclyn Morado", "body": "Lorem ipsum dolor sit amet, consectetur adipisicing...", "email": "WpOUCpdD@hccdxJvT.com" } ... ], "date": { "$date": { "$numberLong": "1332804016000" } }, "permalink": "aRjNnLZkJkTyspAIoRGe", "tags": [ "watchmaker", "santa", "xylophone", "math", "handsaw", "dream", "undershirt", "dolphin", "tanker", "action" ], "title": "Bill of Rights" }
sample_training.routes
Os dados da coleção routes
foram obtidos a partir dos dados do Open Flights . Os documentos desta coleção contêm informações sobre rotas aéreas entre aeroportos.
Cada documento contém informações sobre:
Dados da companhia aérea no subdocumento contendo o nome, o nome alternativo, o identificador exclusivo e o código da companhia aérea IATA,
Os aeroportos de origem e destino, identificados por seu código IATA,
Codeshare de rota e o número de paradas.
Indexes
Esta coleção contém os seguintes índices:
Nome | Index | Descrição |
---|---|---|
|
| Índice de chave primária no campo |
Documento de amostra
{ "_id": { "$oid": "56e9b39b732b6122f877fa5c" }, "airline": { "alias": "2G", "iata": "CRG", "id": 1654, "name": "Cargoitalia" }, "airplane": "A81", "codeshare": "", "dst_airport": "OVB", "src_airport": "BTK", "stops": 0 }
sample_training.trips
A coleção trips
contém dados de passeios de bicicleta do serviço Citibike da cidade de Nova York. Os documentos são compostos de:
Identificador exclusivo da bicicleta,
Hora e data de início e parada da viagem,
Nomes de estações iniciais e finais da viagem e localização geoespacial,
Informações do usuário, como gênero, ano de nascimento e tipo de serviço (Consumidor ou Assinante).
Indexes
Esta coleção contém os seguintes índices:
Nome | Index | Descrição |
---|---|---|
|
| Índice de chave primária no campo |
Documento de amostra
{ "_id": { "$oid": "572bb8222b288919b68abf82" }, "bikeid": 14785, "birth year": 1977, "end station id": 433, "end station location": { "coordinates": [ -73.98057249, 40.72955361 ], "type": "Point" }, "end station name": "E 13 St & Avenue A", "gender": 1, "start station id": 518, "start station location": { "coordinates": [ -73.9734419, 40.74780373 ], "type": "Point" }, "start station name": "E 39 St & 2 Ave", "start time": { "$date": { "$numberLong": "1332804016000" } }, "stop time": { "$date": { "$numberLong": "1352114016000" } }, "tripduration": 812, "usertype": "Subscriber" }
sample_training.zips
A coleção zips
contém informações de cidades dos EUA e seus códigos postais/ceps de área. Os documentos contêm informações sobre o nome da cidade, CEP da área, coordenadas geográficas do centro da cidade (latitude e longitude), estado e população.
Este conjunto de dados é usado para explorar a criação e queries de 2d Index.
Indexes
Esta coleção contém os seguintes índices:
Nome | Index | Descrição |
---|---|---|
|
| Índice de chave primária no campo |
Documento de amostra
{ "_id": { "$oid": "5c8eccc1caa187d17ca6ed29" }, "city": "CLEVELAND", "loc": { "x": 86.559355, "y": 33.992106 }, "pop": 2369, "state": "AL", "zip": "35049" }