Docs Menu
Docs Home
/
MongoDB Atlas
/ / / /

문자열 필드를 인덱싱하는 방법

이 페이지의 내용

  • string 유형에 대한 제한 사항을 검토합니다.
  • 0} 유형에 대한 인덱스 정의 string
  • 0}string 필드 속성 구성
  • 0} 유형에 대한 예시를 사용해 보세요.string

Atlas Search string 유형을 사용하여 문자열 필드를 인덱싱할 수 있습니다. Atlas Search phrase, queryString, span, text, wildcard, regexmoreLikeThis 연산자를 사용하여 string 유형으로 인덱싱된 필드를 쿼리할 수 있습니다.

동적 매핑을 활성화하면 Atlas Search에서 string 유형의 필드를 자동으로 인덱싱합니다. Atlas UI의 비주얼 에디터 또는 JSON 에디터를 사용하여 필드를 string 유형으로 인덱싱할 수 있습니다.

패싯 또는 자동 완성 쿼리에 대한 필드를 인덱싱하는 데 Atlas 검색 string 유형을 사용할 수 없습니다. string 유형을 사용하여 Atlas Search 결과를 정렬하기 위한 필드를 인덱싱할 수 없습니다. 대신 정적 매핑을 사용하여 문자열 필드를 다음 유형으로 인덱싱해야 합니다.

  • 문자열 필드에서 패싯 쿼리를 실행하려면 stringFacet 유형을 사용합니다. Atlas Search는 패싯을 위해 문자열 필드를 동적으로 인덱싱하지 않습니다.

  • 문자열 필드에서 자동 완성 연산자 쿼리를 실행하는 자동 완성 유형입니다. Atlas Search는 자동 완성을 위해 문자열 필드를 동적으로 인덱싱하지 않는다는 점에 유의하세요.

  • Atlas 검색 결과를 문자열 필드별로 정렬하기 위한 토큰 유형입니다. Atlas Search는 결과 정렬을 위해 문자열 필드를 동적으로 인덱싱하지 않습니다.

  • 토큰 유형을 사용하여 같음, in, 범위 연산자를 사용하여 쿼리와 정확히 일치하는 항목을 찾을 수 있습니다. Atlas Search는 이러한 연산자를 사용하여 쿼리할 때 문자열 필드를 token 유형으로 동적으로 인덱스하지 않습니다.

중요

Atlas Search는 분석기 토큰 크기가 32766바이트를 초과하는 문자열 필드를 인덱싱하지 않습니다. 키워드 분석기를 사용하는 경우 32766바이트를 초과하는 문자열 필드는 인덱싱되지 않습니다.

string 유형에 대한 인덱스를 정의하려면 Atlas UI에서 원하는 구성 방법을 선택한 다음 데이터베이스와 컬렉션을 선택하세요.

  1. 인덱스를 구성하려면 Refine Your Index를 클릭합니다.

  2. Field Mappings 섹션에서 Add Field 을 클릭하여 Add Field Mapping창을 엽니다.

  3. Customized Configuration를 클릭합니다.

  4. Field Name 드롭다운에서 인덱스할 필드를 선택합니다.

    참고

    필드 이름 시작 부분에 달러($) 기호가 포함된 필드는 인덱싱할 수 없습니다.

  5. Data Type 드롭다운을 클릭하여 String를 선택합니다.

  6. (선택 사항) 필드에 대해 String Properties를 확장하고 구성합니다. 자세한 내용은 string 필드 속성 구성을 참조하세요.

  7. (선택사항) 해당 필드에 대해 다음과 같은 대체 분석기 설정을 구성하려면 Add Multi Field을(를) 클릭합니다.

    1. Multi Field Name 필드에 대체 분석기의 이름을 입력합니다.

    2. Multi Field Properties 아래에서 대체 분석기에 대한 문자열 필드 속성을 구성합니다. 자세한 내용은 string 필드 속성 구성을 참조하세요.

    3. (선택 사항) Add Another Mult Field을(를) 클릭하고 1단계2단계를 반복하여 필드에 대해 분석기를 더 구성합니다.

  8. Add를 클릭합니다.

다음은 string 유형에 대한 JSON 구문입니다. 기본값 인덱스 정의를 다음으로 변경합니다. 필드에 대한 자세한 내용은 필드 속성을 참조하세요.

{
"mappings": {
"dynamic": true|false,
"fields": {
"<field-name>": {
"type": "string",
"analyzer": "<atlas-search-analyzer>",
"searchAnalyzer": "<atlas-search-analyzer>",
"indexOptions": "docs|freqs|positions|offsets",
"store": true|false,
"ignoreAbove": <integer>,
"multi": {<string-field-definition>},
"norms": "include|omit"
}
}
}
}

Atlas Search string 유형은 다음 매개 변수를 사용합니다.

옵션
유형
필요성
설명
기본값

type

문자열

필수 사항

이 토크나이저 유형을 식별하는 사람이 읽을 수 있는 레이블입니다. 값은 string이어야 합니다.

analyzer

문자열

옵션

필드 인덱싱에 사용할 내장 또는 사용자 지정 분석기의 이름입니다. 값을 지정하지 않으면 기본적으로 다음 순서로 분석기를 상속합니다.

  1. 지정된 경우 인덱스 에 대한 analyzer 옵션입니다.

  2. lucene.standard 분석기입니다.

searchAnalyzer

문자열

옵션

필드를 쿼리할 때 사용할 분석기입니다. 값을 지정하지 않으면 기본적으로 다음 순서로 분석기를 상속합니다.

  1. 지정된 경우 이 필드에 대한 analyzer 옵션입니다.

  2. 지정된 경우 인덱스 에 대한 searchAnalyzer 옵션입니다.

  3. 지정된 경우 인덱스 에 대한 analyzer 옵션입니다.

  4. lucene.standard 분석기입니다.

indexOptions

문자열

옵션

인덱싱된 필드에 대해 저장할 정보의 양입니다. 값은 다음 중 하나일 수 있습니다:

  • docs - 문서만 인덱스합니다. 인덱싱된 용어의 빈도와 위치는 무시됩니다. 해당 용어는 단 한 번만 점수에 반영됩니다.

  • freqs - 문서와 용어 빈도만 인덱스합니다. 인덱싱된 용어의 위치는 무시됩니다.

  • positions - 문서, 용어 빈도, 용어 위치를 인덱스화합니다.

  • offsets - (기본값) 문서, 용어 빈도, 용어 위치 및 용어 오프셋을 인덱스스합니다. 이 옵션은 강조 표시에 필요합니다.

offsets

store

부울

옵션

정확한 문서 텍스트와 분석된 값을 인덱스에 저장할지 여부를 나타내는 플래그입니다. 값은 true 또는 false이 될 수 있습니다. 강조 표시하려면 이 옵션의 값을 true 해야 합니다.

인덱스 크기와 성능 공간을 줄이려면 storefalse로 설정하는 것이 좋습니다. 자세한 내용은 Atlas Search 인덱스 성능을 참조하세요.

true

ignoreAbove

int

옵션

인덱싱할 필드 값의 최대 문자 수입니다. Atlas Search는 필드 값이 지정된 문자 수보다 큰 경우 인덱스를 생성하지 않습니다.

multi

문자열 필드 정의

옵션

객체 에 지정된 대체 분석기 의 이름으로 인덱스 할 문자열 필드 입니다.multi multi 객체 지정에 학습 보려면 멀티 애널라이저아래 예시 참조하세요.

norms

문자열

옵션

채점 시 결과에 필드 길이를 포함할지, 생략할지 여부를 지정하는 문자열입니다. 필드 길이는 분석기가 필드에 대해 생성한 토큰 수에 따라 결정됩니다. 값은 다음 중 하나일 수 있습니다:

  • include - 점수 산정 시 필드 길이를 포함합니다.

  • omit - 점수 산정 시 필드 길이를 생략합니다.

값이 include경우 Atlas Search는 필드의 길이를 사용하여 점수를 매길 때 더 높은 점수를 결정합니다. 예를 들어 두 문서가 Atlas 검색 쿼리와 일치하는 경우 필드 길이가 짧은 문서는 필드 길이가 긴 문서보다 점수가 높습니다.

값이 omit이면 Atlas Search는 점수 산정 시 필드 길이를 무시합니다.

include

다음 인덱스 정의 예시에서는 sample_mflix.movies 컬렉션을 사용합니다. cluster에 이미 샘플 데이터가 로드되어 있는 경우, Atlas UI의 Visual Editor 또는 JSON Editor를 사용하여 인덱스를 구성할 수 있습니다. 원하는 구성 방법을 선택한 후 데이터베이스와 컬렉션을 선택하고 인덱스를 구체화하여 필드 매핑을 추가합니다.

다음 인덱스 정의는 title 필드의 문자열 값을 Atlas Search string 유형으로 인덱스합니다.

  1. Add Field Mapping 창의 Field Name 드롭다운에서 title 을 선택합니다.

  2. Data Type 드롭다운을 클릭하여 String를 선택합니다.

  3. String Properties의 기본 설정을 검토합니다.

  4. Add를 클릭합니다.

기본 인덱스 정의를 다음 인덱스 정의로 바꾸세요.

{
"mappings": {
"dynamic": false,
"fields": {
"title": {
"type": "string"
}
}
}
}

다음 인덱스 정의는 기본 lucene.standard 분석기 외에 lucene.englishlucene.french 분석기를 사용하여 fullplot 필드의 string 값을 인덱싱합니다.

  1. Add Field Mapping 창의 Field Name 드롭다운에서 fullplot 을 선택합니다.

  2. Data Type 드롭다운을 클릭하여 String를 선택합니다.

  3. String Properties의 기본 설정을 검토합니다.

  4. Add Multi Field를 클릭하고 Multi Field Name 필드에 english를 입력한 후 다음 Multi Field Properties를 구성하세요.

    인덱스 분석기

    lucene.language lucene.english 을 선택합니다.

    검색 분석기

    lucene.language lucene.english 을 선택합니다.

  5. Add Another Multi Field를 클릭하고 Multi Field Name 필드에 french를 입력한 후 다음 Multi Field Properties를 구성하세요.

    인덱스 분석기

    lucene.language lucene.french 을 선택합니다.

    검색 분석기

    lucene. language lucene.french 을 선택합니다.

  6. Add를 클릭합니다.

기본 인덱스 정의를 다음 인덱스 정의로 바꾸세요.

{
"mappings": {
"dynamic": false,
"fields": {
"fullplot": {
"type": "string",
"multi": {
"english": {
"type": "string",
"analyzer": "lucene.english"
},
"french": {
"type": "string",
"analyzer": "lucene.french"
}
}
}
}
}
}

돌아가기

objectId