样本训练数据集
在此页面上
sample_training
数据库包含 MongoDB 专属培训课程中使用的一组真实数据。此数据集基于公开可用的数据源,例如:
我们的学生使用这些真实的数据集在我们的私人培训实验室和练习中探索 MongoDB 的功能。
要学习;了解如何将Atlas提供的示例数据加载到集群中,请参阅加载样本数据。
集合
sample_training
数据库包含以下集合:
集合名称 | 说明 |
---|---|
包含 Crunchbase Data 公司信息列表。 | |
包含特定班级的学生成绩信息,包括不同评估的分数。 | |
包含纽约市企业检查列表,包括企业是否未通过或通过检查。 | |
包含以博文形式组织的随机美国参议院演讲以及随机生成的评论。 | |
包含航线信息(出发地和目的地机场、提供服务的航空公司以及航班类型)。该集合用于探索 $graphLookup 聚合阶段的实验。 | |
包含纽约市 Citibike 数据行程数据。这些数据对于探索 $graphLookup 聚合阶段以及展示地理空间查询非常有用。 | |
包含美国一般城市的邮政编码数据。 |
sample_training.companies
该集合包含 Crunchbase 上列出的公司信息。其中有各种信息,例如:公司网站和/或有关公司的博客网站、融资轮次以及与公司相关的已知人士。
索引
该集合包含以下索引:
名称 | Index | 说明 |
---|---|---|
|
|
|
文档样本
{ "_id": { "$oid": "52cdef7c4bab8bd675298291" }, "acquisition": null, "acquisitions": [], "alias_list": null, "blog_feed_url": "http://mobiance.wordpress.com/feed/", "blog_url": "http://mobiance.wordpress.com/", "category_code": "web", "competitions": [], "created_at": "Tue Feb 12 17:31:58 UTC 2008", "crunchbase_url": "http://www.crunchbase.com/company/mobiance", "deadpooled_day": null, "deadpooled_month": null, "deadpooled_url": null, "deadpooled_year": null, "description": null, "email_address": "info@mobiance.com", "external_links": [], "founded_day": { "$numberInt": "1" }, "founded_month": { "$numberInt": "10" }, "founded_year": { "$numberInt": "2004" }, "funding_rounds": [], "homepage_url": "http://www.mobiance.com", "image": { "attribution": null, "available_sizes": [ [ [ { "$numberInt": "150" }, { "$numberInt": "43" } ], "assets/images/resized/0001/1859/11859v1-max-150x150.png" ], [ [ { "$numberInt": "208" }, { "$numberInt": "60" } ], "assets/images/resized/0001/1859/11859v1-max-250x250.png" ], [ [ { "$numberInt": "208" }, { "$numberInt": "60" } ], "assets/images/resized/0001/1859/11859v1-max-450x450.png" ] ] }, "investments": [], "ipo": null, "milestones": [], "name": "Mobiance", "number_of_employees": { "$numberInt": "5" }, "offices": [ { "address1": "BC-3, Atrium Business Center,", "address2": "Coles Road, Frazer Town,", "city": "Bangalore", "country_code": "IND", "description": null, "latitude": null, "longitude": null, "state_code": null, "zip_code": "560005" } ], "overview": "<p>Mobiance provides the technology to track cell phones ...", "partners": [], "permalink": "mobiance", "phone_number": "+91-80- 41264756", "products": [], "providerships": [], "relationships": [ { "is_past": true, "person": { "first_name": "Ritesh", "last_name": "Ambastha", "permalink": "ritesh-ambastha" }, "title": "Product Manager" } ], "screenshots": [], "tag_list": null, "total_money_raised": "$0", "twitter_username": null, "updated_at": "Thu Dec 01 07:37:10 UTC 2011", "video_embeds": [] }
sample_training.grades
该集合具有随机生成的学生成绩。每个文档都包含一个标识班级的 class_id
和一个标识学生的 student_id
。所有学生的课堂考试分数都存储在 scores
数组中,该数组包含子文档,子文档有两个字段,分别代表评估类型和该评估的学生分数。
索引
该集合包含以下索引:
名称 | Index | 说明 |
---|---|---|
|
|
|
文档样本
{ "_id": { "$oid": "56d5f7eb604eb380b0d8d8fa" }, "class_id": { "$numberDouble": "173" }, "scores": [ { "score": { "$numberDouble": "19.81430597438296" }, "type": "exam" }, { "score": { "$numberDouble": "16.851404299968642" }, "type": "quiz" }, { "score": { "$numberDouble": "60.108751761488186" }, "type": "homework" }, { "score": { "$numberDouble": "22.886167083915776" }, "type": "homework" } ], "student_id": { "$numberDouble": "4" } }
sample_training.inspections
inspections
集合取自 NYC OpenData 数据集。每个 inspections
文档包含以下信息:
被检查的企业名称、部门和地址,
检查 ID、结果、日期和证书编号。
索引
该集合包含以下索引:
名称 | Index | 说明 |
---|---|---|
|
|
|
文档样本
{ "_id": { "$oid": "56d61033a378eccde8a8357e" }, "address": { "city": "LAWRENCE", "number": 1, "street": "BAY BLVD", "zip": 11559 }, "business_name": "SPRAGUE OPERATING RESOURCES LLC.", "certificate_number": 3019422, "date": "Mar 3 2015", "id": "11247-2015-ENFO", "result": "Fail", "sector": "Fuel Oil Dealer - 814" }
sample_airbnb.listingsAndReviews
posts
集合是一组随机生成的博文,使用美国参议院演讲稿作为文档正文字段的种子。每个文档包含以下内容:
博文相关信息,如正文、作者、永久链接、日期和标题、
随机生成的标签列表,
随机生成的注释子文档列表。
索引
该集合包含以下索引:
名称 | Index | 说明 |
---|---|---|
|
|
|
文档样本
{ "_id": { "$oid": "50ab0f8bbcf1bfe2536dc3f9" }, "author": "machine", "body": "Amendment I\n<p>Congress shall make no law respecting ... ", "comments": [ { "author": "Santiago Dollins", "body": "Lorem ipsum dolor sit amet, consectetur adipisicing...", "email": "HvizfYVx@pKvLaagH.com" }, { "author": "Jaclyn Morado", "body": "Lorem ipsum dolor sit amet, consectetur adipisicing...", "email": "WpOUCpdD@hccdxJvT.com" } ... ], "date": { "$date": { "$numberLong": "1332804016000" } }, "permalink": "aRjNnLZkJkTyspAIoRGe", "tags": [ "watchmaker", "santa", "xylophone", "math", "handsaw", "dream", "undershirt", "dolphin", "tanker", "action" ], "title": "Bill of Rights" }
sample_training.routes
routes
集合数据来自开放航班数据。此集合中的文档包含有关机场间航线的信息。
每个文档包含以下信息:
子文档中的航空公司数据,包含名称、别名、唯一标识符和 IATA 航空公司代码,
出发机场和目的地机场,已识别它们的 IATA 机场代码,
路线代码共享和站点数量。
索引
该集合包含以下索引:
名称 | Index | 说明 |
---|---|---|
|
|
|
文档样本
{ "_id": { "$oid": "56e9b39b732b6122f877fa5c" }, "airline": { "alias": "2G", "iata": "CRG", "id": 1654, "name": "Cargoitalia" }, "airplane": "A81", "codeshare": "", "dst_airport": "OVB", "src_airport": "BTK", "stops": 0 }
sample_training.trips
trips
集合包含来自纽约市 Citibike 服务的自行车行程数据。这些文档包括:
自行车唯一标识符,
行程开始和结束时间和日期,
行程起点和终点站名称和地理空间位置,
用户信息,例如性别、出生年份和服务类型(客户或订户)。
索引
该集合包含以下索引:
名称 | Index | 说明 |
---|---|---|
|
|
|
文档样本
{ "_id": { "$oid": "572bb8222b288919b68abf82" }, "bikeid": 14785, "birth year": 1977, "end station id": 433, "end station location": { "coordinates": [ -73.98057249, 40.72955361 ], "type": "Point" }, "end station name": "E 13 St & Avenue A", "gender": 1, "start station id": 518, "start station location": { "coordinates": [ -73.9734419, 40.74780373 ], "type": "Point" }, "start station name": "E 39 St & 2 Ave", "start time": { "$date": { "$numberLong": "1332804016000" } }, "stop time": { "$date": { "$numberLong": "1352114016000" } }, "tripduration": 812, "usertype": "Subscriber" }
sample_training.zips
zips
集合包含美国城市及其区域邮政编码的信息。文档包含城市名称、区域邮政编码、市中心地理坐标(纬度和经度)、省/市/自治区和人口的相关信息。
该数据集用于探索 2d 索引创建和查询。
索引
该集合包含以下索引:
名称 | Index | 说明 |
---|---|---|
|
|
|
文档样本
{ "_id": { "$oid": "5c8eccc1caa187d17ca6ed29" }, "city": "CLEVELAND", "loc": { "x": 86.559355, "y": 33.992106 }, "pop": 2369, "state": "AL", "zip": "35049" }