Atlas Data Lake - 미리 보기
Atlas Data Lake 정보
MongoDB Atlas Data Lake는 추출한 데이터 분석에 최적화된 객체 저정 서비스로 거듭났습니다. Atlas Data Lake는 지연 시간이 짧은 쿼리 성능으로 플랫 또는 중첩 데이터에 최적화된 분석 저장 서비스를 제공합니다.
Atlas Data Lake 가 공개 미리 보기로 제공됩니다.
전제 조건
Atlas Data Lake 에는 지정된 주기에서 실행 cloud 백업 작업이 있는 M10
이상의 백업 지원 Atlas cluster 가 필요합니다. 클라우드 백업 에 학습 보려면 클러스터 백업을 참조하세요.
지원되는 데이터 소스의 유형
Atlas Data Lake는 추출된 데이터의 데이터 소스로 Atlas 클러스터의 컬렉션 스냅샷을 지원합니다. Atlas Data Lake는 스냅샷에서 데이터를 자동으로 수집하고, 분석에 최적화된 형식으로 데이터를 분할 및 저장합니다. View에 대한 파이프라인 생성은 지원하지 않습니다.
데이터 저장 형식 및 쿼리 지원
Atlas Data Lake는 다형성 데이터를 지원하는 오픈 소스 표준을 기반으로 하는 분석 지향 형식으로 데이터를 저장합니다. 데이터는 완전 관리되고 파티션 수준에서 인덱싱되며 데이터 증가에 따라 밸런싱됩니다. Atlas Data Lake는 분석 유형 쿼리에 맞게 데이터 추출을 최적화합니다. Atlas Data Lake는 새 데이터를 추출할 때 기존 파일을 리밸런싱해 일관된 성능을 보장하며 데이터 검색을 최소화합니다.
Atlas Data Lake는 빠른 포인트 쿼리 및 집계 쿼리가 가능하도록 구조에 가장 적합한 형식으로 데이터를 저장합니다. 점 쿼리의 경우 Atlas Data Lake의 저장 형식을 사용하면 파티션 찾는 속도가 빨라지므로 성능이 향상됩니다. 집계 유형의 쿼리는 결과를 제공하는 데 필요한 열만 검색합니다. 또한 Atlas Data Lake 파티션 인덱스는 기본 파일을 스캔할 필요 없이 파티션 인덱스에서 직접 결과를 반환하므로 집계 쿼리의 성능이 향상됩니다.
샘플 사용
Atlas Data Lake를 사용하여 다음을 수행할 수 있습니다.
운영 cluster에서 분석 워크로드를 격리합니다.
$out
를 사용해 장기 실행 집계에 대한 스냅샷의 cluster 데이터에 대한 일관된 보기를 제공합니다.다양한 시점의 cluster 데이터 버전을 쿼리하고 비교합니다.
Atlas Data Lake 리전
Atlas Data Lake는 다음 AWS 리전에서 최적화된 저장 공간을 제공합니다.
데이터 레이크 리전 | AWS 리전 |
---|---|
Virginia, USA | 미국 동부 1(us-east-1) |
미국 오리건주 | us-west-2 |
브라질 상파울루 | sa-east-1 |
아일랜드 | eu-west-1 |
영국 런던 | eu-west-2 |
독일 프랑크푸르트 | eu-central-1 |
인도 뭄바이 | ap-south-1 |
싱가포르 | 아시아 태평양 남동부 1(AP-SOUTH-EAST-1) |
호주 시드니 | 아시아 태평양 남동부 2(AP-SOUTH-EAST-2) |
Atlas Data Lake는 수집한 데이터를 저장할 때 Atlas 클러스터와 가장 가까운 리전을 자동으로 선택합니다.
청구
수집한 데이터가 저장된 AWS 리전을 기준으로 매월 GB당 Atlas Data Lake 요금이 발생합니다. Atlas Data Lake 비용이 발생하는 항목은 다음과 같습니다.
데이터 소스에서 수집하는 데이터
클라우드 객체 스토리지에 저장
추출 비용
Atlas Data Lake는 데이터 추출, 업로드, 전송에 사용한 리소스에 대해 요금을 청구합니다. 스냅샷 내보내기 작업에 대한 Atlas Data Lake 요금 청구 기준은 다음과 같습니다.
스냅샷 추출에 대한 GB당 비용
스냅샷 내보내기 다운로드를 위한 AWS 서버의 시간당 비용
스냅샷 내보내기 복원 저장 공간에 대한 시간당 GB당 비용
스냅샷 내보내기 저장 IOPS의 시간당 IOPS당 비용
저장 공간 비용
저장된 데이터 저장 및 액세스에 대한 Atlas Data Lake 요금은 다음을 기준으로 합니다.
Cost per GB per day
Atlas Data Federation을 사용해 Data Lake 데이터 세트를 쿼리할 때 저장 액세스 요청 1,000건당 비용 각 액세스 요청은 Atlas Data Federation이 쿼리를 처리하기 위해 가져오는 Data Lake 데이터 세트의 데이터 파티션에 해당합니다.
참고
이제 Atlas Data Federation이 쿼리를 처리하는 데 드는 데이터 양에 한도를 설정하여 비용을 관리할 수 있습니다. 자세한 내용은 Atlas Data Federation 쿼리 제한 관리를 참조하세요.
자세한 내용은 Atlas 요금 페이지를 참조하세요.