필드 매핑 정의
Atlas Search 인덱스를 생성할 때 다음을 수행할 수 있습니다.
정적 매핑을 사용하여 인덱싱할 필드를 지정합니다.
동적 매핑을 사용하여 지원되는 모든 필드 유형을 자동으로 인덱싱하도록 Atlas Search를 구성합니다.
정적 매핑을 사용하려면 인덱싱할 컬렉션에 필드를 명시적으로 포함해야 합니다. type
필드에서 필드 정의에 있는 필드의 데이터 유형을 지정합니다. 또는 각 데이터 유형마다 하나씩 필드에 대한 필드 정의 배열을 지정해도 됩니다.
1 { 2 "mappings": { 3 "dynamic": <boolean>, 4 "fields": { 5 "<field-name>": [ 6 { 7 "type": "<field-type>", 8 ... 9 }, 10 ... 11 ], 12 ... 13 } 14 } 15 }
Atlas Search 인덱스 정의의 필드를 어떤 순서로든 정의할 수 있습니다.
정적 및 동적 매핑
Atlas Search에서 정적 및 동적 매핑을 활용하여 컬렉션의 동적으로 인덱싱 가능한 모든 필드를 자동으로 인덱싱할지 여부를 설정할 수 있습니다.
정적 매핑
정적 매핑을 사용하여 동적으로 인덱싱하지 않을 필드의 인덱스 옵션을 설정하거나, 인덱스 내의 다른 필드와 독립적으로 단일 필드를 구성하고 싶을 때 활용할 수 있습니다.
정적 매핑을 위해서는 mappings.dynamic
을 false
로 설정하고 mappings.fields
를 사용하여 인덱싱할 필드를 지정합니다. Atlas Search는 특정 옵션이 있는 지정된 필드만 인덱스합니다. 인덱싱된 필드에 다형성 데이터가 포함되어 있을 경우, Atlas Search는 해당 필드의 인덱스 정의에 명시된 매핑에 해당하는 문서들만을 인덱싱하고, 해당 필드의 인덱스 정의에 지정된 데이터 유형이 아닌 값들을 포함하는 문서들은 무시합니다.
점 표기법을 사용하여 중첩된 필드를 정적으로 인덱스할 수 없습니다. 중첩된 필드의 인덱스를 정의할 때는 해당 중첩 필드의 각 상위 필드에 대한 매핑을 정의해야 합니다. 예시를 보려면 address
라는 필드 안에 중첩된 city
라는 필드에 대한 인덱스 구문을 보여 주는 이 페이지의 예시를 참조하세요.
동적 매핑
스키마가 정기적으로 변경되거나 알 수 없는 경우 또는 Atlas Search를 실험할 때 동적 매핑을 사용합니다. 동적 매핑을 사용하도록 전체 인덱스를 구성하거나, document
유형의 필드와 같은 개별 필드를 동적으로 매핑하도록 지정할 수 있습니다. 동적 매핑을 사용하기 전에 데이터 유형표를 참조하세요.
동적 매핑의 경우 mappings.dynamic
을 true
로 설정합니다. Atlas Search는 각 문서에서 지원되는 유형 의 필드를 자동으로 인덱싱합니다. 문자열 유형의 필드의 경우 Atlas Search는 mongot
에 필드를 저장합니다.
참고
동적으로 매핑된 인덱스는 정적으로 매핑된 인덱스보다 더 많은 디스크 공간을 차지하며 성능이 저하될 수 있습니다.
데이터 유형
Atlas Search는 다음 BSON 데이터 유형을지원하지 않습니다:
Decimal128
범위가 있는 자바스크립트 코드
최대 키
Min key
정규 표현식
타임스탬프
다음 표에는 지원되는 BSON 데이터 유형과 BSON 데이터 유형을 인덱싱하는 데 사용할 수 있는 Atlas Search 필드 유형이 나열되어 있습니다. 이 표는 또한 동적 매핑을 활성화하면 Atlas Search 인덱스에 자동으로 포함되는 Atlas Search 필드 유형과 필드 값을 쿼리하는 데 사용할 수 있는 연산자 및 수집기를 보여줍니다.
참고
다형성 데이터를 포함하는 필드를 동적으로 인덱싱할 때, Atlas Search는 해당 데이터와 일치하는 모든 동적 인덱싱 가능한 필드 유형으로 자동으로 그 필드를 인덱싱합니다 필드에 Atlas Search가 자동으로 인덱싱하지 않는 유형의 데이터가 포함되어 있는 경우, Atlas Search는 해당 데이터를 인덱싱하지 않습니다.
BSON 유형 | Atlas Seach 필드 유형 | 동적 인덱싱 | 연산자와 콜렉터 |
---|---|---|---|
✓ | 배열의 데이터 유형을 지원하는 연산자입니다. | ||
부울 | ✓ | ||
날짜 | ✓ | ||
날짜 | |||
Double | ✓ | ||
Double | |||
Double | knnVector(사용 중단됨) | ||
32비트 정수 | ✓ | ||
32비트 정수 | |||
64비트 정수 | ✓ | ||
64비트 정수 | |||
Null | N/A | ✓ | |
객체 | ✓ | 모든 연산자 | |
객체 | EmbeddedDocument(객체 배열용) | ||
ObjectId | ✓ | ||
문자열 | ✓ | ||
문자열 | |||
문자열 | |||
문자열 | |||
✓ |
일부 제한 사항이 적용됩니다. 자세히 알아보려면 배열의 요소를 인덱스하는 방법을 참조하세요.
string
유형의 경우 moreLikeThis 및 queryString 연산자는 문자열 배열을 지원하지 않습니다.
Atlas Search는 정적 및 동적으로 인덱싱된 필드 모두에 대해 null 값을 자동으로 인덱싱하므로 null 값 인덱싱을 위한 필드 유형을 포함하지 않습니다.
제한 사항
Atlas Search 는 복제본 세트 또는 단일 샤드 에서 2,100,000,000 인덱스 객체보다 큰 인덱스에 대한 변경 사항 복제를 중지하며, 여기서 각 인덱스된 문서 또는 중첩된 embeddedDocument
는 단일 객체 로 계산됩니다. 즉, 인덱스 를 쿼리할 수 있지만 오래된 결과가 나타날 수 있습니다.
이 제한을 초과할 수 있는 필드를 인덱스 하려는 경우 클러스터 를 샤드 해야 합니다. 예를 예시 embeddedDocuments 필드 유형을 사용하는 경우 Atlas Search 는 이 제한을 초과하여 객체를 인덱스 할 수 있습니다. 이로 인해 인덱스 가 STALE
상태로 전환되어 쿼리 결과가 오래될 수 있습니다.
필드 이름 시작 부분에 달러($
) 기호가 포함된 필드는 인덱싱할 수 없습니다.
여러 데이터 유형을 가진 인덱스 필드 설정하기
필드를 여러 유형으로 인덱싱하려면, 필드 정의 배열에서 해당 필드의 유형들을 정의하세요.
예시
다음 예에서는 필드를 여러 유형으로 인덱싱하기 위한 필드 정의를 보여줍니다.
1 { 2 ... 3 "mappings": { 4 "dynamic": <boolean>, 5 "fields": { 6 "<field-name>": [ 7 { 8 "type": "<field-type>", 9 ... 10 }, 11 { 12 "type": "<field-type>", 13 ... 14 }, 15 ... 16 ], 17 ... 18 }, 19 ... 20 } 21 }
예시
동적 매핑 예시
다음 인덱스 정의 예시에서는 정적 매핑을 사용합니다.
기본 인덱스 분석기는 lucene.standard입니다.
기본 검색 분석기는 lucene.standard입니다. 검색어가 Atlas Search 인덱스에 저장되는 방식과 다르게 구문 분석되도록 하려면 검색 분석기를 변경할 수 있습니다.
인덱스는 정적 필드 매핑(
dynamic
:false
)을 지정합니다. 즉, 명시적으로 언급되지 않은 필드는 인덱싱되지 않습니다. 따라서 인덱스 정의에는 다음이 포함됩니다:address
필드는document
유형입니다. 여기에는 두 개의 하위 필드city
및state
가 포함되어 있습니다.city
하위 필드는 쿼리에 기본적으로 lucene.simple 분석기를 사용합니다.ignoreAbove
옵션을 사용하여 길이가 255바이트를 초과하는 문자열을 무시합니다.state
하위 필드는 쿼리에 기본적으로 lucene.english 분석기를 사용합니다.company
필드는string
유형입니다. 쿼리에 기본적으로 lucene.whitespace 분석기를 사용합니다. 여기에는mySecondaryAnalyzer
라는 이름의multi
분석기가 있으며, 쿼리에 대해 기본적으로 lucene.french 분석기를 사용합니다.multi
분석기에 대해 자세히 알아보려면 경로 구성을 참조하십시오.문자열 배열인
employees
필드입니다. 쿼리에 기본적으로 lucene.standard 분석기를 사용합니다. 인덱싱 배열의 경우, Atlas Search에는 배열 요소의 데이터 유형만 필요합니다. 인덱스 정의에서 데이터가 배열에 포함되도록 지정할 필요는 없습니다.
{ "analyzer": "lucene.standard", "searchAnalyzer": "lucene.standard", "mappings": { "dynamic": false, "fields": { "address": { "type": "document", "fields": { "city": { "type": "string", "analyzer": "lucene.simple", "ignoreAbove": 255 }, "state": { "type": "string", "analyzer": "lucene.english" } } }, "company": { "type": "string", "analyzer": "lucene.whitespace", "multi": { "mySecondaryAnalyzer": { "type": "string", "analyzer": "lucene.french" } } }, "employees": { "type": "string", "analyzer": "lucene.standard" } } } }
결합된 매핑 예시
다음 인덱스 정의 예시에서는 정적 매핑과 동적 매핑을 모두 사용합니다.
기본 인덱스 분석기는 lucene.standard입니다.
기본 검색 분석기는 lucene.standard입니다. 검색어가 Atlas Search 인덱스에 저장되는 방식과 다르게 구문 분석되도록 하려면 검색 분석기를 변경할 수 있습니다.
인덱스는 정적 필드 매핑(
dynamic
:false
)을 지정합니다. 즉, 명시적으로 언급되지 않은 필드는 인덱싱되지 않습니다. 따라서 인덱스 정의에는 다음이 포함됩니다.company
필드는string
유형입니다. 쿼리에 기본적으로 lucene.whitespace 분석기를 사용합니다. 여기에는mySecondaryAnalyzer
라는 이름의multi
분석기가 있으며, 쿼리에 대해 기본적으로 lucene.french 분석기를 사용합니다.multi
분석기에 대해 자세히 알아보려면 경로 구성을 참조하십시오.employees
필드는 문자열 배열로 이루어집니다. 쿼리에 기본적으로 lucene.standard 분석기를 사용합니다.address
필드는document
유형입니다. 여기에는 두 개의 하위 필드city
및state
가 포함되어 있습니다. 문서에 중첩된 각 필드를 명시적으로 언급하는 대신 인덱스 정의를 통해 문서의 모든 하위 필드에 대한 동적 매핑을 사용할 수 있습니다. 쿼리에는 기본적으로 lucene.standard 분석기를 사용합니다.
{ "analyzer": "lucene.standard", "searchAnalyzer": "lucene.standard", "mappings": { "dynamic": false, "fields": { "company": { "type": "string", "analyzer": "lucene.whitespace", "multi": { "mySecondaryAnalyzer": { "type": "string", "analyzer": "lucene.french" } } }, "employees": { "type": "string", "analyzer": "lucene.standard" }, "address": { "type": "document", "dynamic": true } } } }