“文档” 菜单
文档首页
/
MongoDB 阿特拉斯
/ /

样本训练数据集

在此页面上

  • 集合
  • sample_training.companies
  • sample_training.grades
  • sample_training.inspections
  • sample_training.posts
  • sample_training.routes
  • sample_training.trips
  • sample_training.zips

sample_training 数据库包含 MongoDB 专属培训课程中使用的一组真实数据。此数据集基于公开可用的数据源,例如:

我们的学生使用这些真实的数据集在我们的私人培训实验室和练习中探索 MongoDB 的功能。

要了解如何将 Atlas 提供的样本数据加载到集群中,请参阅加载样本数据。

sample_training数据库包含以下集合:

集合名称
说明
companies
包含 Crunchbase 数据 列表 公司信息。
包含特定班级的学生成绩信息,包括不同评估的分数。
包含纽约市企业检查列表,包括企业是否未通过或通过检查。
包含以博文形式组织的随机美国参议院演讲以及随机生成的评论。
包含航线信息(出发地和目的地机场、提供服务的航空公司以及航班类型)。该集合用于探索 $graphLookup 聚合阶段的实验。
包含纽约市 Citibike 数据 行程数据。此数据可用于探索 $graphLookup 聚合阶段和展示 地理空间查询
包含美国一般城市的邮政编码数据。

该集合包含 Crunchbase 上列出的公司信息。其中有各种信息,例如:公司网站和/或有关公司的博客网站、融资轮次以及与公司相关的已知人士。

该集合包含以下索引:

名称
指数
说明
_id_
{ "_id": 1 }
_id 字段的主键索引。
{
"_id": {
"$oid": "52cdef7c4bab8bd675298291"
},
"acquisition": null,
"acquisitions": [],
"alias_list": null,
"blog_feed_url": "http://mobiance.wordpress.com/feed/",
"blog_url": "http://mobiance.wordpress.com/",
"category_code": "web",
"competitions": [],
"created_at": "Tue Feb 12 17:31:58 UTC 2008",
"crunchbase_url": "http://www.crunchbase.com/company/mobiance",
"deadpooled_day": null,
"deadpooled_month": null,
"deadpooled_url": null,
"deadpooled_year": null,
"description": null,
"email_address": "info@mobiance.com",
"external_links": [],
"founded_day": {
"$numberInt": "1"
},
"founded_month": {
"$numberInt": "10"
},
"founded_year": {
"$numberInt": "2004"
},
"funding_rounds": [],
"homepage_url": "http://www.mobiance.com",
"image": {
"attribution": null,
"available_sizes": [
[
[
{
"$numberInt": "150"
},
{
"$numberInt": "43"
}
],
"assets/images/resized/0001/1859/11859v1-max-150x150.png"
],
[
[
{
"$numberInt": "208"
},
{
"$numberInt": "60"
}
],
"assets/images/resized/0001/1859/11859v1-max-250x250.png"
],
[
[
{
"$numberInt": "208"
},
{
"$numberInt": "60"
}
],
"assets/images/resized/0001/1859/11859v1-max-450x450.png"
]
]
},
"investments": [],
"ipo": null,
"milestones": [],
"name": "Mobiance",
"number_of_employees": {
"$numberInt": "5"
},
"offices": [
{
"address1": "BC-3, Atrium Business Center,",
"address2": "Coles Road, Frazer Town,",
"city": "Bangalore",
"country_code": "IND",
"description": null,
"latitude": null,
"longitude": null,
"state_code": null,
"zip_code": "560005"
}
],
"overview": "<p>Mobiance provides the technology to track cell phones ...",
"partners": [],
"permalink": "mobiance",
"phone_number": "+91-80- 41264756",
"products": [],
"providerships": [],
"relationships": [
{
"is_past": true,
"person": {
"first_name": "Ritesh",
"last_name": "Ambastha",
"permalink": "ritesh-ambastha"
},
"title": "Product Manager"
}
],
"screenshots": [],
"tag_list": null,
"total_money_raised": "$0",
"twitter_username": null,
"updated_at": "Thu Dec 01 07:37:10 UTC 2011",
"video_embeds": []
}

该集合具有随机生成的学生成绩。每个文档都包含一个标识班级的 class_id 和一个标识学生的 student_id。所有学生的课堂考试分数都存储在 scores 数组中,该数组包含子文档,子文档有两个字段,分别代表评估类型和该评估的学生分数。

该集合包含以下索引:

名称
指数
说明
_id_
{ "_id": 1 }
_id 字段的主键索引。
{
"_id": {
"$oid": "56d5f7eb604eb380b0d8d8fa"
},
"class_id": {
"$numberDouble": "173"
},
"scores": [
{
"score": {
"$numberDouble": "19.81430597438296"
},
"type": "exam"
},
{
"score": {
"$numberDouble": "16.851404299968642"
},
"type": "quiz"
},
{
"score": {
"$numberDouble": "60.108751761488186"
},
"type": "homework"
},
{
"score": {
"$numberDouble": "22.886167083915776"
},
"type": "homework"
}
],
"student_id": {
"$numberDouble": "4"
}
}

inspections 集合取自 NYC OpenData 数据集。每个 inspections 文档包含以下信息:

  • 被检查的企业名称、部门和地址,

  • 检查 ID、结果、日期和证书编号。

该集合包含以下索引:

名称
指数
说明
_id_
{ "_id": 1 }
_id 字段的主键索引。
{
"_id": {
"$oid": "56d61033a378eccde8a8357e"
},
"address": {
"city": "LAWRENCE",
"number": 1,
"street": "BAY BLVD",
"zip": 11559
},
"business_name": "SPRAGUE OPERATING RESOURCES LLC.",
"certificate_number": 3019422,
"date": "Mar 3 2015",
"id": "11247-2015-ENFO",
"result": "Fail",
"sector": "Fuel Oil Dealer - 814"
}

posts 集合是一组随机生成的博文,使用美国参议院演讲稿作为文档正文字段的种子。每个文档包含以下内容:

  • 博文相关信息,如正文、作者、永久链接、日期和标题、

  • 随机生成的标签列表,

  • 随机生成的注释子文档列表。

该集合包含以下索引:

名称
指数
说明
_id_
{ "_id": 1 }
_id 字段的主键索引。
{
"_id": {
"$oid": "50ab0f8bbcf1bfe2536dc3f9"
},
"author": "machine",
"body": "Amendment I\n<p>Congress shall make no law respecting ... ",
"comments": [
{
"author": "Santiago Dollins",
"body": "Lorem ipsum dolor sit amet, consectetur adipisicing...",
"email": "HvizfYVx@pKvLaagH.com"
},
{
"author": "Jaclyn Morado",
"body": "Lorem ipsum dolor sit amet, consectetur adipisicing...",
"email": "WpOUCpdD@hccdxJvT.com"
}
...
],
"date": {
"$date": {
"$numberLong": "1332804016000"
}
},
"permalink": "aRjNnLZkJkTyspAIoRGe",
"tags": [
"watchmaker",
"santa",
"xylophone",
"math",
"handsaw",
"dream",
"undershirt",
"dolphin",
"tanker",
"action"
],
"title": "Bill of Rights"
}

routes集合数据源自 Open Flights 数据。该集合的文档包含有关机场之间航线的信息。

每个文档包含以下信息:

  • 子文档中的航空公司数据,包含名称、别名、唯一标识符和 IATA 航空公司代码,

  • 源机场和目的地机场,确定其 IATA 机场代码,

  • 路线代码共享和站点数量。

该集合包含以下索引:

名称
指数
说明
_id_
{ "_id": 1 }
_id 字段的主键索引。
{
"_id": {
"$oid": "56e9b39b732b6122f877fa5c"
},
"airline": {
"alias": "2G",
"iata": "CRG",
"id": 1654,
"name": "Cargoitalia"
},
"airplane": "A81",
"codeshare": "",
"dst_airport": "OVB",
"src_airport": "BTK",
"stops": 0
}

trips 集合包含来自纽约市 Citibike 服务的自行车行程数据。这些文档包括:

  • 自行车唯一标识符,

  • 行程开始和结束时间和日期,

  • 行程起点和终点站名称和地理空间位置,

  • 用户信息,例如性别、出生年份和服务类型(客户或订户)。

该集合包含以下索引:

名称
指数
说明
_id_
{ "_id": 1 }
_id 字段的主键索引。
{
"_id": {
"$oid": "572bb8222b288919b68abf82"
},
"bikeid": 14785,
"birth year": 1977,
"end station id": 433,
"end station location": {
"coordinates": [
-73.98057249,
40.72955361
],
"type": "Point"
},
"end station name": "E 13 St & Avenue A",
"gender": 1,
"start station id": 518,
"start station location": {
"coordinates": [
-73.9734419,
40.74780373
],
"type": "Point"
},
"start station name": "E 39 St & 2 Ave",
"start time": {
"$date": {
"$numberLong": "1332804016000"
}
},
"stop time": {
"$date": {
"$numberLong": "1352114016000"
}
},
"tripduration": 812,
"usertype": "Subscriber"
}

zips 集合包含美国城市及其区域邮政编码的信息。文档包含城市名称、区域邮政编码、市中心地理坐标(纬度和经度)、省/市/自治区和人口的相关信息。

该数据集用于探索 2d 索引创建和查询。

该集合包含以下索引:

名称
指数
说明
_id_
{ "_id": 1 }
_id 字段的主键索引。
{
"_id": {
"$oid": "5c8eccc1caa187d17ca6ed29"
},
"city": "CLEVELAND",
"loc": {
"x": 86.559355,
"y": 33.992106
},
"pop": 2369,
"state": "AL",
"zip": "35049"
}
← 商店
天气 →