샘플 트레이닝 데이터 세트
이 페이지의 내용
sample_training
데이터베이스에는 MongoDB Private 교육 프로그램에서 사용되는 실제 데이터 세트가 포함되어 있습니다. 이 데이터 세트는 다음과 같은 공개적으로 사용 가능한 데이터 소스를 기반으로 합니다.
학생들은 이러한 사실적인 데이터 세트를 사용하여 개인 교육 랩 및 실습에서 MongoDB의 기능을 탐색합니다.
Atlas 에서 제공하는 샘플 데이터를 클러스터 에 로드하는 방법을 학습 보려면 샘플 데이터 로드를 참조하세요.
컬렉션
sample_training
데이터베이스에 다음 컬렉션이 포함됩니다.
컬렉션 이름 | 설명 |
---|---|
Crunchbase Data 회사 정보 목록이 포함되어 있습니다. | |
다양한 평가 점수를 포함하여 특정 수업에 대한 학생 성적 정보가 포함되어 있습니다. | |
사업체가 검사를 통과하지 못했는지 또는 통과했는지 여부를 포함하여 뉴욕시 사업체 검사 목록이 포함되어 있습니다. | |
무작위로 생성된 댓글과 함께 블로그 포스트로 구성된 무작위 미국 상원 연설이 포함되어 있습니다. | |
출발지 및 목적지 공항, 서비스 항공사 및 항공기 유형이 포함된 항공사 노선에 대한 정보가 포함되어 있습니다. 이 컬렉션은 $graphLookup 집계 단계를 학습하는 실습에서 사용됩니다. | |
미국 일반 도시 우편 번호 데이터가 포함되어 있습니다. |
sample_training.companies
이 컬렉션에는 Crunchbase에 상장된 회사에 대한 정보가 포함되어 있습니다. 여기에는 회사 웹 사이트 및 회사에 대한 블로그 웹 사이트, 자금 조달 라운드 및 회사와 관련된 알려진 개인과 같은 다양한 정보가 있습니다.
Indexes
이 컬렉션에는 다음과 같은 인덱스가 포함되어 있습니다.
이름 | Index | 설명 |
---|---|---|
_id_ | { "_id": 1 } | _id 필드의 기본 키 인덱스입니다. |
샘플 문서
{ "_id": { "$oid": "52cdef7c4bab8bd675298291" }, "acquisition": null, "acquisitions": [], "alias_list": null, "blog_feed_url": "http://mobiance.wordpress.com/feed/", "blog_url": "http://mobiance.wordpress.com/", "category_code": "web", "competitions": [], "created_at": "Tue Feb 12 17:31:58 UTC 2008", "crunchbase_url": "http://www.crunchbase.com/company/mobiance", "deadpooled_day": null, "deadpooled_month": null, "deadpooled_url": null, "deadpooled_year": null, "description": null, "email_address": "info@mobiance.com", "external_links": [], "founded_day": { "$numberInt": "1" }, "founded_month": { "$numberInt": "10" }, "founded_year": { "$numberInt": "2004" }, "funding_rounds": [], "homepage_url": "http://www.mobiance.com", "image": { "attribution": null, "available_sizes": [ [ [ { "$numberInt": "150" }, { "$numberInt": "43" } ], "assets/images/resized/0001/1859/11859v1-max-150x150.png" ], [ [ { "$numberInt": "208" }, { "$numberInt": "60" } ], "assets/images/resized/0001/1859/11859v1-max-250x250.png" ], [ [ { "$numberInt": "208" }, { "$numberInt": "60" } ], "assets/images/resized/0001/1859/11859v1-max-450x450.png" ] ] }, "investments": [], "ipo": null, "milestones": [], "name": "Mobiance", "number_of_employees": { "$numberInt": "5" }, "offices": [ { "address1": "BC-3, Atrium Business Center,", "address2": "Coles Road, Frazer Town,", "city": "Bangalore", "country_code": "IND", "description": null, "latitude": null, "longitude": null, "state_code": null, "zip_code": "560005" } ], "overview": "<p>Mobiance provides the technology to track cell phones ...", "partners": [], "permalink": "mobiance", "phone_number": "+91-80- 41264756", "products": [], "providerships": [], "relationships": [ { "is_past": true, "person": { "first_name": "Ritesh", "last_name": "Ambastha", "permalink": "ritesh-ambastha" }, "title": "Product Manager" } ], "screenshots": [], "tag_list": null, "total_money_raised": "$0", "twitter_username": null, "updated_at": "Thu Dec 01 07:37:10 UTC 2011", "video_embeds": [] }
sample_training.grades
이 컬렉션에는 무작위로 생성된 학생 성적이 있습니다. 각 문서에는 수업을 식별하는 class_id
와 학생을 식별하는 student_id
가 포함되어 있습니다. 모든 학생의 수업 시험 점수는 scores
배열에 저장되며, 이 배열에는 평가 유형과 해당 평가의 학생 점수를 나타내는 두 개의 필드가 있는 하위 문서가 포함되어 있습니다.
Indexes
이 컬렉션에는 다음과 같은 인덱스가 포함되어 있습니다.
이름 | Index | 설명 |
---|---|---|
_id_ | { "_id": 1 } | _id 필드의 기본 키 인덱스입니다. |
샘플 문서
{ "_id": { "$oid": "56d5f7eb604eb380b0d8d8fa" }, "class_id": { "$numberDouble": "173" }, "scores": [ { "score": { "$numberDouble": "19.81430597438296" }, "type": "exam" }, { "score": { "$numberDouble": "16.851404299968642" }, "type": "quiz" }, { "score": { "$numberDouble": "60.108751761488186" }, "type": "homework" }, { "score": { "$numberDouble": "22.886167083915776" }, "type": "homework" } ], "student_id": { "$numberDouble": "4" } }
sample_training.inspections
inspections
컬렉션은 NYC OpenData 데이터 세트에서 가져왔습니다. 각 inspections
문서에는 다음에 대한 정보가 포함되어 있습니다.
검사된 비즈니스 이름, 업종, 주소,
검사 ID, 결과, 날짜, 인증서 번호.
Indexes
이 컬렉션에는 다음과 같은 인덱스가 포함되어 있습니다.
이름 | Index | 설명 |
---|---|---|
_id_ | { "_id": 1 } | _id 필드의 기본 키 인덱스입니다. |
샘플 문서
{ "_id": { "$oid": "56d61033a378eccde8a8357e" }, "address": { "city": "LAWRENCE", "number": 1, "street": "BAY BLVD", "zip": 11559 }, "business_name": "SPRAGUE OPERATING RESOURCES LLC.", "certificate_number": 3019422, "date": "Mar 3 2015", "id": "11247-2015-ENFO", "result": "Fail", "sector": "Fuel Oil Dealer - 814" }
sample_airbnb.listingsAndReviews
posts
컬렉션은 미국 상원 연설을 문서 본문 필드의 시드로 사용하여 만든 무작위로 생성된 블로그 포스트 세트입니다. 각 문서에서 다음을 찾을 수 있습니다.
본문, 작성자, 퍼머링크, 날짜 및 제목과 같은 블로그 포스트에 대한 정보,
무작위로 생성된 태그 목록,
무작위로 생성된 댓글 하위 문서 목록.
Indexes
이 컬렉션에는 다음과 같은 인덱스가 포함되어 있습니다.
이름 | Index | 설명 |
---|---|---|
_id_ | { "_id": 1 } | _id 필드의 기본 키 인덱스입니다. |
샘플 문서
{ "_id": { "$oid": "50ab0f8bbcf1bfe2536dc3f9" }, "author": "machine", "body": "Amendment I\n<p>Congress shall make no law respecting ... ", "comments": [ { "author": "Santiago Dollins", "body": "Lorem ipsum dolor sit amet, consectetur adipisicing...", "email": "HvizfYVx@pKvLaagH.com" }, { "author": "Jaclyn Morado", "body": "Lorem ipsum dolor sit amet, consectetur adipisicing...", "email": "WpOUCpdD@hccdxJvT.com" } ... ], "date": { "$date": { "$numberLong": "1332804016000" } }, "permalink": "aRjNnLZkJkTyspAIoRGe", "tags": [ "watchmaker", "santa", "xylophone", "math", "handsaw", "dream", "undershirt", "dolphin", "tanker", "action" ], "title": "Bill of Rights" }
sample_training.routes
routes
컬렉션 데이터는 Open Flights 데이터에서 제공되었습니다. 이 컬렉션의 문서에는 공항 간 항공 노선에 대한 정보가 포함되어 있습니다.
각 문서에는 다음에 대한 정보가 포함됩니다.
이름, 별칭, 고유 식별자, IATA 항공사 코드를 포함하는 하위 문서의 항공사 데이터
출발지 및 목적지 공항, IATA 공항 코드 식별,
노선 공동운항 및 경유지 수입니다.
Indexes
이 컬렉션에는 다음과 같은 인덱스가 포함되어 있습니다.
이름 | Index | 설명 |
---|---|---|
_id_ | { "_id": 1 } | _id 필드의 기본 키 인덱스입니다. |
샘플 문서
{ "_id": { "$oid": "56e9b39b732b6122f877fa5c" }, "airline": { "alias": "2G", "iata": "CRG", "id": 1654, "name": "Cargoitalia" }, "airplane": "A81", "codeshare": "", "dst_airport": "OVB", "src_airport": "BTK", "stops": 0 }
sample_training.trips
trips
컬렉션에는 뉴욕시 Citibike 서비스의 자전거 여행 데이터가 포함되어 있습니다. 문서는 다음과 같이 구성됩니다.
자전거 고유 식별자,
여행 시작 및 종료 시간과 날짜,
여행 시작 및 종료 역 이름과 지리 공간적 위치,
성별, 생년월일, 서비스 유형(고객 또는 가입자) 등의 사용자 정보.
Indexes
이 컬렉션에는 다음과 같은 인덱스가 포함되어 있습니다.
이름 | Index | 설명 |
---|---|---|
_id_ | { "_id": 1 } | _id 필드의 기본 키 인덱스입니다. |
샘플 문서
{ "_id": { "$oid": "572bb8222b288919b68abf82" }, "bikeid": 14785, "birth year": 1977, "end station id": 433, "end station location": { "coordinates": [ -73.98057249, 40.72955361 ], "type": "Point" }, "end station name": "E 13 St & Avenue A", "gender": 1, "start station id": 518, "start station location": { "coordinates": [ -73.9734419, 40.74780373 ], "type": "Point" }, "start station name": "E 39 St & 2 Ave", "start time": { "$date": { "$numberLong": "1332804016000" } }, "stop time": { "$date": { "$numberLong": "1352114016000" } }, "tripduration": 812, "usertype": "Subscriber" }
sample_training.zips
zips
컬렉션에는 미국 도시 및 해당 지역 우편 번호에 대한 정보가 포함되어 있습니다. 문서에는 도시 이름, 지역 우편 번호, 도심 지리 좌표(위도 및 경도), 주, 인구에 대한 정보가 포함됩니다.
이 데이터 세트는 2D 인덱스 생성 및 쿼리를 탐색하는 데 사용됩니다.
Indexes
이 컬렉션에는 다음과 같은 인덱스가 포함되어 있습니다.
이름 | Index | 설명 |
---|---|---|
_id_ | { "_id": 1 } | _id 필드의 기본 키 인덱스입니다. |
샘플 문서
{ "_id": { "$oid": "5c8eccc1caa187d17ca6ed29" }, "city": "CLEVELAND", "loc": { "x": 86.559355, "y": 33.992106 }, "pop": 2369, "state": "AL", "zip": "35049" }