Docs Menu
Docs Home
/
MongoDB Atlas
/ /

샘플 트레이닝 데이터 세트

이 페이지의 내용

  • 컬렉션
  • sample_training.companies
  • sample_training.grades
  • sample_training.inspections
  • sample_airbnb.listingsAndReviews
  • sample_training.routes
  • sample_training.trips
  • sample_training.zips

sample_training 데이터베이스에는 MongoDB Private 교육 프로그램에서 사용되는 실제 데이터 세트가 포함되어 있습니다. 이 데이터 세트는 다음과 같은 공개적으로 사용 가능한 데이터 소스를 기반으로 합니다.

학생들은 이러한 사실적인 데이터 세트를 사용하여 개인 교육 랩 및 실습에서 MongoDB의 기능을 탐색합니다.

Atlas 에서 제공하는 샘플 데이터를 클러스터 에 로드하는 방법을 학습 보려면 샘플 데이터 로드를 참조하세요.

sample_training 데이터베이스에 다음 컬렉션이 포함됩니다.

컬렉션 이름
설명
Crunchbase Data 회사 정보 목록이 포함되어 있습니다.
다양한 평가 점수를 포함하여 특정 수업에 대한 학생 성적 정보가 포함되어 있습니다.
사업체가 검사를 통과하지 못했는지 또는 통과했는지 여부를 포함하여 뉴욕시 사업체 검사 목록이 포함되어 있습니다.
무작위로 생성된 댓글과 함께 블로그 포스트로 구성된 무작위 미국 상원 연설이 포함되어 있습니다.
출발지 및 목적지 공항, 서비스 항공사 및 항공기 유형이 포함된 항공사 노선에 대한 정보가 포함되어 있습니다. 이 컬렉션은 $graphLookup 집계 단계를 학습하는 실습에서 사용됩니다.
뉴욕시 Citibike Data 여행 데이터를 포함합니다. 이 데이터는 $graphLookup 집계 단계를 탐색하고 지리 공간적 쿼리를 보여 주는 데 유용합니다.
미국 일반 도시 우편 번호 데이터가 포함되어 있습니다.

이 컬렉션에는 Crunchbase에 상장된 회사에 대한 정보가 포함되어 있습니다. 여기에는 회사 웹 사이트 및 회사에 대한 블로그 웹 사이트, 자금 조달 라운드 및 회사와 관련된 알려진 개인과 같은 다양한 정보가 있습니다.

이 컬렉션에는 다음과 같은 인덱스가 포함되어 있습니다.

이름
Index
설명
_id_
{ "_id": 1 }
_id 필드의 기본 키 인덱스입니다.
{
"_id": {
"$oid": "52cdef7c4bab8bd675298291"
},
"acquisition": null,
"acquisitions": [],
"alias_list": null,
"blog_feed_url": "http://mobiance.wordpress.com/feed/",
"blog_url": "http://mobiance.wordpress.com/",
"category_code": "web",
"competitions": [],
"created_at": "Tue Feb 12 17:31:58 UTC 2008",
"crunchbase_url": "http://www.crunchbase.com/company/mobiance",
"deadpooled_day": null,
"deadpooled_month": null,
"deadpooled_url": null,
"deadpooled_year": null,
"description": null,
"email_address": "info@mobiance.com",
"external_links": [],
"founded_day": {
"$numberInt": "1"
},
"founded_month": {
"$numberInt": "10"
},
"founded_year": {
"$numberInt": "2004"
},
"funding_rounds": [],
"homepage_url": "http://www.mobiance.com",
"image": {
"attribution": null,
"available_sizes": [
[
[
{
"$numberInt": "150"
},
{
"$numberInt": "43"
}
],
"assets/images/resized/0001/1859/11859v1-max-150x150.png"
],
[
[
{
"$numberInt": "208"
},
{
"$numberInt": "60"
}
],
"assets/images/resized/0001/1859/11859v1-max-250x250.png"
],
[
[
{
"$numberInt": "208"
},
{
"$numberInt": "60"
}
],
"assets/images/resized/0001/1859/11859v1-max-450x450.png"
]
]
},
"investments": [],
"ipo": null,
"milestones": [],
"name": "Mobiance",
"number_of_employees": {
"$numberInt": "5"
},
"offices": [
{
"address1": "BC-3, Atrium Business Center,",
"address2": "Coles Road, Frazer Town,",
"city": "Bangalore",
"country_code": "IND",
"description": null,
"latitude": null,
"longitude": null,
"state_code": null,
"zip_code": "560005"
}
],
"overview": "<p>Mobiance provides the technology to track cell phones ...",
"partners": [],
"permalink": "mobiance",
"phone_number": "+91-80- 41264756",
"products": [],
"providerships": [],
"relationships": [
{
"is_past": true,
"person": {
"first_name": "Ritesh",
"last_name": "Ambastha",
"permalink": "ritesh-ambastha"
},
"title": "Product Manager"
}
],
"screenshots": [],
"tag_list": null,
"total_money_raised": "$0",
"twitter_username": null,
"updated_at": "Thu Dec 01 07:37:10 UTC 2011",
"video_embeds": []
}

이 컬렉션에는 무작위로 생성된 학생 성적이 있습니다. 각 문서에는 수업을 식별하는 class_id와 학생을 식별하는 student_id가 포함되어 있습니다. 모든 학생의 수업 시험 점수는 scores 배열에 저장되며, 이 배열에는 평가 유형과 해당 평가의 학생 점수를 나타내는 두 개의 필드가 있는 하위 문서가 포함되어 있습니다.

이 컬렉션에는 다음과 같은 인덱스가 포함되어 있습니다.

이름
Index
설명
_id_
{ "_id": 1 }
_id 필드의 기본 키 인덱스입니다.
{
"_id": {
"$oid": "56d5f7eb604eb380b0d8d8fa"
},
"class_id": {
"$numberDouble": "173"
},
"scores": [
{
"score": {
"$numberDouble": "19.81430597438296"
},
"type": "exam"
},
{
"score": {
"$numberDouble": "16.851404299968642"
},
"type": "quiz"
},
{
"score": {
"$numberDouble": "60.108751761488186"
},
"type": "homework"
},
{
"score": {
"$numberDouble": "22.886167083915776"
},
"type": "homework"
}
],
"student_id": {
"$numberDouble": "4"
}
}

inspections 컬렉션은 NYC OpenData 데이터 세트에서 가져왔습니다. 각 inspections 문서에는 다음에 대한 정보가 포함되어 있습니다.

  • 검사된 비즈니스 이름, 업종, 주소,

  • 검사 ID, 결과, 날짜, 인증서 번호.

이 컬렉션에는 다음과 같은 인덱스가 포함되어 있습니다.

이름
Index
설명
_id_
{ "_id": 1 }
_id 필드의 기본 키 인덱스입니다.
{
"_id": {
"$oid": "56d61033a378eccde8a8357e"
},
"address": {
"city": "LAWRENCE",
"number": 1,
"street": "BAY BLVD",
"zip": 11559
},
"business_name": "SPRAGUE OPERATING RESOURCES LLC.",
"certificate_number": 3019422,
"date": "Mar 3 2015",
"id": "11247-2015-ENFO",
"result": "Fail",
"sector": "Fuel Oil Dealer - 814"
}

posts 컬렉션은 미국 상원 연설을 문서 본문 필드의 시드로 사용하여 만든 무작위로 생성된 블로그 포스트 세트입니다. 각 문서에서 다음을 찾을 수 있습니다.

  • 본문, 작성자, 퍼머링크, 날짜 및 제목과 같은 블로그 포스트에 대한 정보,

  • 무작위로 생성된 태그 목록,

  • 무작위로 생성된 댓글 하위 문서 목록.

이 컬렉션에는 다음과 같은 인덱스가 포함되어 있습니다.

이름
Index
설명
_id_
{ "_id": 1 }
_id 필드의 기본 키 인덱스입니다.
{
"_id": {
"$oid": "50ab0f8bbcf1bfe2536dc3f9"
},
"author": "machine",
"body": "Amendment I\n<p>Congress shall make no law respecting ... ",
"comments": [
{
"author": "Santiago Dollins",
"body": "Lorem ipsum dolor sit amet, consectetur adipisicing...",
"email": "HvizfYVx@pKvLaagH.com"
},
{
"author": "Jaclyn Morado",
"body": "Lorem ipsum dolor sit amet, consectetur adipisicing...",
"email": "WpOUCpdD@hccdxJvT.com"
}
...
],
"date": {
"$date": {
"$numberLong": "1332804016000"
}
},
"permalink": "aRjNnLZkJkTyspAIoRGe",
"tags": [
"watchmaker",
"santa",
"xylophone",
"math",
"handsaw",
"dream",
"undershirt",
"dolphin",
"tanker",
"action"
],
"title": "Bill of Rights"
}

routes 컬렉션 데이터는 Open Flights 데이터에서 제공되었습니다. 이 컬렉션의 문서에는 공항 간 항공 노선에 대한 정보가 포함되어 있습니다.

각 문서에는 다음에 대한 정보가 포함됩니다.

  • 이름, 별칭, 고유 식별자, IATA 항공사 코드를 포함하는 하위 문서의 항공사 데이터

  • 출발지 및 목적지 공항, IATA 공항 코드 식별,

  • 노선 공동운항 및 경유지 수입니다.

이 컬렉션에는 다음과 같은 인덱스가 포함되어 있습니다.

이름
Index
설명
_id_
{ "_id": 1 }
_id 필드의 기본 키 인덱스입니다.
{
"_id": {
"$oid": "56e9b39b732b6122f877fa5c"
},
"airline": {
"alias": "2G",
"iata": "CRG",
"id": 1654,
"name": "Cargoitalia"
},
"airplane": "A81",
"codeshare": "",
"dst_airport": "OVB",
"src_airport": "BTK",
"stops": 0
}

trips 컬렉션에는 뉴욕시 Citibike 서비스의 자전거 여행 데이터가 포함되어 있습니다. 문서는 다음과 같이 구성됩니다.

  • 자전거 고유 식별자,

  • 여행 시작 및 종료 시간과 날짜,

  • 여행 시작 및 종료 역 이름과 지리 공간적 위치,

  • 성별, 생년월일, 서비스 유형(고객 또는 가입자) 등의 사용자 정보.

이 컬렉션에는 다음과 같은 인덱스가 포함되어 있습니다.

이름
Index
설명
_id_
{ "_id": 1 }
_id 필드의 기본 키 인덱스입니다.
{
"_id": {
"$oid": "572bb8222b288919b68abf82"
},
"bikeid": 14785,
"birth year": 1977,
"end station id": 433,
"end station location": {
"coordinates": [
-73.98057249,
40.72955361
],
"type": "Point"
},
"end station name": "E 13 St & Avenue A",
"gender": 1,
"start station id": 518,
"start station location": {
"coordinates": [
-73.9734419,
40.74780373
],
"type": "Point"
},
"start station name": "E 39 St & 2 Ave",
"start time": {
"$date": {
"$numberLong": "1332804016000"
}
},
"stop time": {
"$date": {
"$numberLong": "1352114016000"
}
},
"tripduration": 812,
"usertype": "Subscriber"
}

zips 컬렉션에는 미국 도시 및 해당 지역 우편 번호에 대한 정보가 포함되어 있습니다. 문서에는 도시 이름, 지역 우편 번호, 도심 지리 좌표(위도 및 경도), 주, 인구에 대한 정보가 포함됩니다.

이 데이터 세트는 2D 인덱스 생성 및 쿼리를 탐색하는 데 사용됩니다.

이 컬렉션에는 다음과 같은 인덱스가 포함되어 있습니다.

이름
Index
설명
_id_
{ "_id": 1 }
_id 필드의 기본 키 인덱스입니다.
{
"_id": {
"$oid": "5c8eccc1caa187d17ca6ed29"
},
"city": "CLEVELAND",
"loc": {
"x": 86.559355,
"y": 33.992106
},
"pop": 2369,
"state": "AL",
"zip": "35049"
}

돌아가기

보급품 상점