연합 데이터베이스 인스턴스 배포
예상 완료 시간: 15 분
튜토리얼의 이 부분에서는 Atlas UI 에서 다음 빠른 시작 마법사를 사용하여 연합 데이터베이스 인스턴스 를 배포하는 방법을 안내합니다.
피드 다운스트림 시스템 마법사는 클러스터 에서 데이터를 내보내고 Atlas 데이터를 Parquet 로 변환하는 연합 데이터베이스 인스턴스 를 설정하다 하는 데 도움이 됩니다. CSV, , BSON 또는 MongoDB Extended JSON 을 호출하고,Atlas Triggers 를 사용하여 Amazon Web Services 지정된 간격으로 데이터를 S 버킷에 복사합니다.3
샘플 데이터로 탐색 마법사를 사용하면 샘플 데이터로 로드된 연합 데이터베이스 인스턴스 를 설정하다 하여 연합 데이터베이스 인스턴스 에 연결하고 쿼리를 실행 하는 방법을 시연할 수 있습니다.
클러스터 간 데이터 쿼리 마법사를 사용하면 여러 Atlas 클러스터의 데이터에 액세스하는 연합 데이터베이스 인스턴스 를 설정하다 하여 모든 클러스터의 컬렉션에서 연합 쿼리를 실행 수 있습니다.
저장 구성 옵션에 학습 보려면 연합 데이터베이스 인스턴스에 대한 데이터 저장소 정의를 참조하세요.
필요한 액세스 권한
연합 데이터베이스 인스턴스를 배포하려면 프로젝트에 대한 Project Owner
액세스 권한이 있어야 합니다. Organization Owner
액세스 권한이 있는 사용자는 연합 데이터베이스 인스턴스를 배포하기 전에 프로젝트에 Project Owner
으)로 추가되어야 합니다.
전제 조건
튜토리얼의 이 부분을 완료하려면 다음 전제 조건을 충족하는지 확인하세요.
MongoDB Atlas 계정이 아직 없는 경우 생성합니다.
피드 다운스트림 시스템 마법사의 경우 다음이 필요합니다.
,Amazon Web Services CLI 계정에액세스 하도록 구성됨 Amazon Web Services . 또는 IAM 역할 을 생성할 수 Amazon Web Services있는 권한으로 관리 콘솔에 액세스 할 수 있어야 합니다.
추출된 데이터를 저장할 수 있는 S3 버킷입니다.
데이터베이스가 있는 하나 이상의 Atlas 클러스터.
클러스터 간 데이터 쿼리 마법사의 경우 다음이 필요합니다.
연합 데이터베이스 인스턴스 에 사용할 동일한 프로젝트 에 하나 이상의 Atlas cluster 가 배포되었습니다.
하나 이상의 데이터베이스 컬렉션. 컬렉션이 아직 없는 경우 샘플 데이터를 로드 할 수 있습니다.
피드 다운스트림 시스템 마법사 사용
Feed Downstream Systems 마법사를 사용하면 일정에 따라 Atlas 클러스터의 데이터를 AWS S3 버킷에 끊임없이 기록하는 연합 데이터베이스 인스턴스를 설정할 수 있습니다.
데이터 소스를 지정합니다.
드롭다운에서 데이터 소스 로 사용할 Atlas cluster 를 선택합니다. 기본값 으로 Atlas Data Federation 은 이 클러스터 에 모든 컬렉션을 추가합니다. 데이터의 하위 집합을 사용하려면 Specific Collections 을 클릭하고 데이터베이스를 확장한 다음 연합 데이터베이스 인스턴스 에 추가하려는 컬렉션을 선택합니다.
팁
데이터베이스 및 컬렉션을 필터하다 하려면 Specific Collections 필드 에 텍스트를 입력합니다. 대화 상자에는 검색 기준과 일치하는 이름을 가진 데이터베이스 및 컬렉션만 표시됩니다.
Continue를 클릭합니다.
Amazon Web Services Atlas 에 대한 Amazon Web Services IAM 역할 Atlas 을 선택합니다.
역할 선택 드롭다운 목록에서 Atlas가 승인한 기존 Amazon Web Services IAM 역할을 선택하거나 Authorize an AWS IAM Role 를 선택하여 새 역할을 승인할 수 있습니다.
Atlas에 사용하도록 인증된 기존 역할을 선택했다면 다음 단계로 넘어가서 AWS S3 버킷의 목록을 볼 수 있습니다.
기존 역할을 사용할 수 있도록 Atlas를 인증하거나 새 역할을 생성하려는 경우, 아래 단계를 완료한 후에 그 다음 단계로 넘어가세요.
드롭다운에서 Authorize an AWS IAM Role 을 선택하여 새 역할을 승인하거나 기존 역할을 선택합니다.
Role Authorization 섹션에서 Amazon Web Services ARN 과 고유한 외부 ID를 사용하여 기존 또는 새 Amazon Web Services IAM 역할의 신뢰 관계에 Atlas를 추가합니다.
Atlas UI 에서 다음 중 하나를 클릭합니다.
은(는)ARN 및 고유한 외부 를 사용하여 Create new AWS IAM role ID 새 Atlas Amazon Web Services IAM 역할의 신뢰 관계에 를 추가하는 방법을 보여줍니다. 새 역할을 만들려면 Atlas UI의 단계를 따르세요. 자세한 내용 은 Amazon Web Services CLI 로 새 역할 생성하기를 참조하세요.
새 역할을 인증할 때 워크플로를 종료하는 경우:
Atlas 는 역할 의 유효성을 검사하기 전에 연합 데이터베이스 인스턴스 생성하지 않습니다. Go Atlas Integrations 페이지로 하여 새 역할 을 인증 한 다음 IAM 역할 ARN 이 있을 때 Amazon Web Services 연합 데이터베이스 인스턴스 배포 절차를 다시 시작할 수 있습니다.
Atlas는 역할의 유효성을 검사한 후에 연합 데이터베이스 인스턴스를 생성하지 않습니다. 다만 해당 역할은 역할 선택 드롭다운에 포함되며, 연합 데이터베이스 인스턴스 생성 시 사용할 수 있습니다. 해당 역할을 다시 인증할 필요는 없습니다.
Use existing AWS IAM role 은(는) ARN 과 고유한 외부 ID를 사용하여 기존 AWS IAM 역할의 신뢰 관계에 Atlas를 추가하는 방법을 보여줍니다. 기존 역할의 신뢰 관계에 Atlas를 추가하려면 Atlas UI에 명시되어 있는 단계대로 하세요. 자세한 내용 은 기존 역할에 신뢰 관계 추가 를 참조하세요.
중요
나중에 사용자 지정 AWS 역할 ARN을 수정할 경우, 해당 역할의 액세스 정책에 연합 데이터베이스 인스턴스용 S3 리소스에 대한 적절한 액세스 권한이 포함되어 있는지 확인하세요.
학습 내용은 통합 Amazon Web Services 액세스 설정 및 클라우드 제공자 액세스 역할 생성을 참조하세요.
Validate AWS IAM role를 클릭합니다.
데이터 추출을 예약합니다.
섹션의 $out 을 사용하여 클러스터 에서 S3 버킷으로 데이터를 지속적으로 복사하도록 를 trigger 예약합니다.Atlas Schedule Queries
Repeat Once By 드롭다운을 사용하여 Atlas cluster 에서 데이터를 추출할 빈도를 지정합니다.
선택 사항. 어떤 이유로든 쿼리를 놓친 경우 Atlas Data Federation에서 동일한 쿼리를 다시 실행해야 하는지 여부를 지정합니다. 기본적으로 이 기능은 비활성화되어 있어 Atlas Data Federation이 누락된 쿼리를 다시 실행할 수 있습니다. 또는 누락된 쿼리를 건너뛰고 따라잡지 않으려면 Skip Catch Up Events 을(를) 토글합니다.
선택 사항. Atlas Data Federation이 S3 버킷에 데이터를 쓸 때 데이터에 사용할 형식을 선택합니다. Atlas Data Federation은 Parquet 을 지원합니다. , CSV , BSON및 MongoDB 확장 JSON.
Atlas Data Federation이 S3 버킷에 쓰는 각 파일의 크기를 제한하려면 Max File Size 를 지정합니다. 예를 들어 Max File Size 를 100MB로 설정하고 쿼리가 1GB의 데이터를 반환하는 경우, Atlas Data Federation은 각 100MB인 10개의 파일로 S3 버킷에 쿼리를 씁니다.
Amazon Web Services 접두사 입력 대상 S3 버킷에 해당합니다.
Date Field 에 인덱싱된 날짜 필드의 이름을 입력하고 드롭다운을 사용하여 값의 형식을 지정합니다. 다운스트림으로 복사하려는 모든 컬렉션에는 타임스탬프를 값으로 저장하는 인덱싱된 필드가 있어야 합니다.
Continue를 클릭합니다.
샘플 데이터로 탐색 마법사 사용
샘플 데이터로 탐색 마법사를 사용하면 샘플 데이터로 로드된 연합 데이터베이스 인스턴스를 설정할 수 있습니다.
이 연합 데이터베이스 인스턴스 에는 쿼리 실행을 연습하는 데 사용할 수 있는 다음과 같은 샘플 데이터 세트가 포함되어 있습니다.
/airbnb/listingsAndReviews/{bedrooms int}/{review_scores.review_scores_rating int}/
이 경로는 별장 목록 세부 정보 및 고객 리뷰가 포함된
airbnb
데이터 세트를 참조합니다. 이 데이터 세트에 대해 자세히 알아보려면 샘플 AirBnB 목록 데이터 세트를 참조하세요.이 경로의 경우 연합 데이터베이스 인스턴스는
bedrooms
필드 및review_scores.review_score_ratings
필드에 대한 쿼리에 최적화된 파티션을 사용합니다./analytics/accounts/{limit int}/
이 경로는 일반 금융 서비스 애플리케이션용 데이터가 포함된
analytics
데이터 세트를 참조합니다. 이 데이터 세트에 대해 자세히 알아보려면 샘플 분석 데이터 세트를 참조하세요.이 경로의 경우, 연합 데이터베이스 인스턴스는
limit
필드에 대한 쿼리에 최적화된 파티션을 사용합니다./analytics/customers/{birthdate isodate}/
이 데이터는 일반적인 금융 서비스 애플리케이션 용 컬렉션이 포함된
analytics
데이터 세트를 참조합니다. 이 데이터 세트에 학습 보려면 샘플 분석 데이터 세트를 참조하세요.이 경로의 경우, 연합 데이터베이스 인스턴스는
birthdate
필드에 대한 쿼리에 최적화된 파티션을 사용합니다./analytics/transactions/{account_id int}/
이 경로는 일반 금융 서비스 애플리케이션에 대한 데이터가 포함된
analytics
데이터 세트를 참조합니다. 이 데이터 세트에 대해 자세히 알아보려면 샘플 분석 데이터 세트를 참조하세요.이 경로의 경우, 연합 데이터베이스 인스턴스는
account_id
필드에 대한 쿼리에 최적화된 파티션을 사용합니다./mflix/movies/{type string}/{year int}/
이 경로는 영화 및 영화관 관련 데이터가 포함된
mflix
데이터 세트를 참조합니다. 이 데이터 세트에 대해 자세히 알아보려면 샘플 Mflix 데이터 세트를 참조하세요.이 경로의 경우, 연합 데이터베이스 인스턴스 는
type
및year
필드에 대한 쿼리에 최적화된 파티션을 사용합니다./mflix/sessions.json
이 경로는 영화 및 영화관 관련 데이터가 포함된
mflix
데이터 세트를 참조합니다. 이 데이터 세트에 대해 자세히 알아보려면 샘플 Mflix 데이터 세트를 참조하세요.이 경로에는 어떤 파티션 속성도 포함되어 있지 않습니다. 컬렉션 내 데이터에 관한 쿼리의 경우, Data Federation이 해당 컬렉션 내 파일을 전부 검색합니다.
/mflix/theaters/{theaterId string}/{location.address.zipcode string}/
이 경로는 영화 및 영화관 관련 데이터가 포함된
mflix
데이터 세트를 참조합니다. 이 데이터 세트에 대해 자세히 알아보려면 샘플 Mflix 데이터 세트를 참조하세요.이 경로의 경우, 연합 데이터베이스 인스턴스 는
theaterId
및location.address.zipcode
필드에 대한 쿼리에 최적화된 파티션을 사용합니다./mflix/users.json
이 경로는 영화 및 영화관에 대한 데이터가 포함된
mflix
컬렉션을 참조합니다. 이 데이터 세트에 대해 자세히 알아보려면 샘플 Mflix 데이터 세트를 참조하세요.이 경로에는 어떤 파티션 속성도 포함되어 있지 않습니다. 컬렉션 내 데이터에 관한 쿼리의 경우, 연합 데이터베이스 인스턴스가 해당 컬렉션 내 파일을 전부 검색합니다.
/nyc-yellow-cab-trips/{trip_start_isodate isodate}/{passenger_count int}/{fare_type string}/
이 경로는 여행 날짜, 요금, 승객 수 등 여행에 대한 데이터가 포함된
nyc-yellow-cab-trips
데이터 세트를 참조합니다.이 경로의 경우 연합 데이터베이스 인스턴스 는
trip_start_isodate
,passenger_count
및fare_type
필드에 대한 쿼리에 최적화된 파티션을 사용합니다.
클러스터 간 데이터 쿼리 마법사 사용
클러스터 간 데이터 쿼리 마법사를 사용하면 여러 Atlas 클러스터의 데이터에 액세스하는 연합 데이터베이스 인스턴스를 설정할 수 있습니다.
데이터 소스로 사용할 Atlas cluster를 지정합니다.
드롭다운에서 데이터 소스로 사용할 Atlas 클러스터를 선택하세요. Atlas는 이 드롭다운에 포함된 현행 Atlas 프로젝트에 속해 있는 클러스터만 표시합니다.
데이터베이스를 확장하고 연합 데이터베이스 인스턴스에 추가하려는 컬렉션을 선택합니다.
팁
데이터베이스 및 컬렉션을 필터하다 하려면 Specific collections 필드 에 텍스트를 입력합니다. 대화 상자에는 검색 기준과 일치하는 이름을 가진 데이터베이스 및 컬렉션만 표시됩니다.
선택 사항. Cluster Read Preference 설정을 확장하여 다음 필드를 구성합니다.
필드 이름설명Read Preference Mode읽기 요청을 라우팅할 복제본 세트 멤버를 지정합니다. 드롭다운에서 다음 중 하나를 선택할 수 있습니다.
primary
- 모든 읽기 요청을 복제본 세트 프라이머리로 라우팅합니다.primaryPreferred
-primary
를 사용할 수 없는 경우에만 모든 읽기 요청을 복제본 세트 프라이머리 및 세컨더리 멤버로 라우팅합니다.secondary
- 모든 읽기 요청을 복제본 세트의 세컨더리 멤버로 라우팅합니다.secondaryPreferred
-secondary
멤버를 사용할 수 없는 경우에만 모든 읽기 요청을 복제본 세트 의 세컨더리 멤버와 샤딩된 클러스터의 프라이머리 멤버로 라우팅합니다.nearest
- 멤버가 프라이머리 멤버인지 세컨더리멤버인지에 관계없이 모든 읽기 요청을 임의의 적격 복제본 세트 멤버로 라우팅합니다.
Atlas cluster 를 저장 로 추가하는 경우 기본값 은
secondary
입니다.연합 데이터베이스 인스턴스 저장 구성에서 아무것도 설정하다 하지 않은 경우 기본값 은
nearest
입니다. 학습 내용은 읽기 설정 모드 를 참조하세요.TagSets읽기 요청을 라우팅하려는 복제본 세트 멤버의 이름 및 값 쌍이 포함된 태그 또는 태그를 지정하다 사양 문서의 목록을 지정합니다. 학습 내용은 읽기 설정 태그 세트를 참조하세요.Maxstaleness Seconds세컨더리에서 읽기에 대한 최대 복제 지연 또는 '비활성'을 지정합니다. 학습 내용은 읽기 설정 maxStalenessSeconds를 참조하세요.Add Atlas cluster and collection 를 클릭하고 데이터 소스로 사용하려는 모든 Atlas 클러스터에 대해 이 단계를 반복합니다.
클러스터 추가가 완료되면 Continue 을(를) 클릭합니다.
다음 단계
이제 연합 데이터베이스 인스턴스가 배포 되었으므로 연합 데이터베이스 인스턴스에 대한 연결 구성으로 진행합니다.