Google Cloud Platform Google Cloud Platform 스토리지 버킷
Atlas Data Federation Atlas GCP Data Federation 은 연합 데이터베이스 인스턴스 저장소로 GCP Storage 버킷을 지원합니다. 데이터에 대한 쿼리를 실행 하려면 연합 데이터베이스 인스턴스 에서 Cloud Storage 버킷에 대한 매핑을 정의해야 합니다.
참고
이 페이지에서는 객체를 파일이라고 하고 구분 기호로 구분된 접두사를 디렉토리라고 합니다. 그러나 이러한 객체 저장 서비스는 실제로 파일 시스템이 아니며 모든 경우에 하드 드라이브의 파일과 동일한 동작을 하지 않습니다.
Google Cloud Platform 스토리지 Google Cloud Platform 버킷 구성 예시
데이터 센터에서 수집한 데이터가 포함된 Google Cloud Platform Storage 버킷 을 예로 들어 보겠습니다.Google Cloud Platform datacenter-alpha
|--metrics |--hardware
/metrics/hardware
경로는 데이터 센터 하드웨어에서 파생된 지표가 포함된 JSON 파일을 저장합니다. 여기서 각 파일 이름은 해당 파일이 다루는 24시간 기간의 UNIX 타임스탬프(밀리초)입니다.
/hardware/1564671291998.json
구성은 다음과 같습니다.
Google Cloud Platform 리전 의 Google Cloud Platform
datacenter-alpha
Google Cloud Platform Storage 버킷에 연합 데이터베이스 인스턴스 저장 를 정의합니다.us-central1
Google Cloud Platform 연합 데이터베이스 인스턴스 저장 는metrics
디렉토리 경로에 있는 데이터 파일만 포함하도록 특별히 제한됩니다./
구분 기호는 탐색 및 검색을 용이하게 하기 위해 파일 시스템 계층 구조를 시뮬레이션하기 위해 정의됩니다.hardware
폴더의 파일을 MongoDB 데이터베이스datacenter-alpha-metrics
및 컬렉션hardware
에 매핑합니다. 구성 매핑에는 파일 이름에 암시된 타임스탬프를 캡처하기 위한 구문 분석 논리가 포함되어 있습니다.
{ "stores" : [ { "name" : "datacenter-alpha", "provider" : "gcs", "region" : "us-central1", "bucket" : "datacenter-alpha", "prefix": "metrics", "delimiter": "/" } ], "databases" : [ { "name" : "datacenter-alpha-metrics", "collections" : [ { "name" : "hardware", "dataSources" : [ { "storeName" : "datacenter-alpha", "path" : "/hardware/{date date}" } ] } ] } ] }
Atlas Data FederationAtlas Data Federation 은 Google Cloud Platform Storage 버킷 를 구문 분석하고 Google Cloud Platform datacenter-alpha
에 있는 모든 파일을 /metrics/hardware/
처리합니다. collections
객체 는 경로 구문 분석 구문을 사용하여 date
8601 각 문서 의 필드 (ISO- 날짜)에 파일 이름을 매핑합니다. 일치하는 date
필드 가 문서 에 없는 경우 Atlas Data Federation 이 해당 필드를 추가합니다.
연합 데이터베이스 인스턴스 에 연결된 사용자는 MongoDB MongoDB 쿼리 언어 및 지원되는 애그리게이션을 사용하여 컬렉션 을 통해 GCP GCP 스토리지 버킷의 데이터를 분석 할 수 datacenter-alpha-metrics.hardware
있습니다.
구성 형식
Atlas Data Federation Google Cloud PlatformGoogle Cloud Platform 에서 Atlas Data Federation 을 지원 하기 위해 연합 데이터베이스 인스턴스 구성은 다음과 같은 프로토타입 형식을 갖습니다.
1 { 2 "stores" : [ 3 { 4 "name" : "<string>", 5 "provider" : "<string>", 6 "region" : "<string>", 7 "bucket" : "<string>", 8 "prefix": "<string>", 9 "delimiter": "<string>" 10 } 11 ], 12 "databases" : [ 13 { 14 "name" : "<string>", 15 "collections" : [ 16 { 17 "name" : "<string>", 18 "dataSources" : [ 19 { 20 "storeName" : "<string>", 21 "path" : "<string>", 22 "defaultFormat" : "<string>", 23 "provenanceFieldName": "<string>", 24 "omitAttributes": <boolean> 25 } 26 ] 27 } 28 ], 29 "maxWildcardCollections" : <integer>, 30 "views" : [ 31 { 32 "name" : "<string>", 33 "source" : "<string>", 34 "pipeline" : "<string>" 35 } 36 ] 37 } 38 ] 39 } 40
필드 | 유형 | 필요성 | 설명 | ||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 배열 | 필수 사항 | 각 객체가 연합 데이터베이스 인스턴스와 연결할 데이터 저장소를 나타내는 객체 배열입니다. 연합 데이터베이스 인스턴스 저장소는 다음을 캡처합니다.
Atlas Data Federation은 | ||||||||||||
| 문자열 | 필수 사항 | 연합 데이터베이스 인스턴스 저장 의 이름입니다. | ||||||||||||
| 문자열 | 필수 사항 | 데이터가 저장되는 cloud 제공자 의 이름입니다. Google Cloud Platform Storage 버킷의 값은 이어야 | ||||||||||||
| 문자열 | 필수 사항 | Google Cloud Platform 스토리지 버킷이 호스팅되는 Google Cloud Platform 리전 의 이름입니다.Google Cloud Platform Google Cloud Platform 유효한 리전 이름 목록은 Google Cloud Platform (GCP)을 참조하세요. | ||||||||||||
| 문자열 | 필수 사항 | Google Google Cloud Platform Cloud Platform 스토리지 버킷의 이름입니다. Atlas Data Federation 이 액세스 해야 하는 Google Cloud Platform 저장소 버킷의 이름과 정확히 일치해야 합니다.Google Cloud Platform Atlas Data Federation | ||||||||||||
| 문자열 | 옵션 | Google Cloud Platform 스토리지 버킷에서 파일을 검색할 때 접두사 Atlas Data Federation 이 적용됩니다.Atlas Data Federation Google Cloud Platform 예를 예시 다음과 같은 구조의 Google Cloud Platform Google Cloud Platform Storage 버킷 을 가정해 보겠습니다.
연합 데이터베이스 인스턴스 저장 는 기본값은 Google Cloud Platform 모든 파일을 검색하는 Google Cloud Platform 스토리지 버킷의 루트입니다. | ||||||||||||
| 문자열 | 옵션 | 연합 데이터베이스 인스턴스 저장 에서 | ||||||||||||
| 배열 | 필수 사항 | 각 객체 가 데이터베이스, 해당 컬렉션 및 선택적으로 컬렉션의뷰를 나타내는 객체 배열입니다. 각 데이터베이스 에는 여러 개의 | ||||||||||||
| 문자열 | 필수 사항 | Atlas Data Federation이 데이터 저장소에 포함된 데이터를 매핑하는 데이터베이스의 이름입니다. | ||||||||||||
| 배열 | 필수 사항 | 각 객체 가 | ||||||||||||
| 문자열 | 필수 사항 | Atlas Data Federation 이 각 컬렉션 이름에 | ||||||||||||
| 배열 | 필수 사항 | 각 객체 가 컬렉션 과 매핑할 | ||||||||||||
| 문자열 | 필수 사항 |
| ||||||||||||
| 문자열 | 필수 사항 | Atlas Data Federation 이 파일을 예를 예시 다음과 같은 구조의 이라는 Google Cloud Platform Google Cloud Platform Storage 버킷을 가정해 보겠습니다.
경로에
자세한 내용은 S3 데이터 경로 정의를 참조하세요.
동일한 유형의 속성을 지정하는 경우 다음 중 하나를 수행하세요.
| ||||||||||||
| 문자열 | 옵션 | Data Federation이
참고파일 형식이 이를 생략할 경우 Data Federation은 일부 파일 바이트를 처리하여 파일 형식을 감지하려고 시도합니다. | ||||||||||||
| 문자열 | 옵션 | 결과에 있는 문서의 출처를 포함하는 필드의 이름입니다. 스토리지 구성에서 이 설정을 지정하면 Atlas Data Federation은 결과의 각 문서에 대해 다음 필드를 반환합니다.
Atlas UI의 비주얼 편집기를 사용하여 이 설정을 구성할 수 없습니다. | ||||||||||||
| 부울 | 옵션 | Atlas Data Federation이 컬렉션의 문서에 추가하는 속성(키 및 값 쌍)을 생략할지 여부를 지정하는 플래그입니다. 다음 값 중 하나를 지정할 수 있습니다.
생략하면 기본적으로 예를 예시, |