공백 분석기
whitespace
분석기는 공백 문자를 찾을 때마다 텍스트를 검색 가능한 용어(토큰)로 나눕니다. 모든 텍스트는 원래 대소문자를 그대로 유지합니다.
Refine Your Index 작업을 수행하면 Atlas UI Visual Editor에서 whitespace
분석기가 내장 정적 문자열에 대해 생성하는 토큰을 확인할 수 있습니다. Index
Configurations 섹션에는 View text
analysis of your selected index configuration을 확장할 때 whitespace
분석기가 생성하는 인덱스 및 검색 토큰이 표시되므로 인덱스에 사용할 분석기를 쉽게 선택할 수 있습니다.
중요
Atlas Search는 분석기 토큰 크기가 32766바이트를 초과하는 문자열 필드를 인덱싱하지 않습니다. 키워드 분석기를 사용하는 경우 32766바이트를 초과하는 문자열 필드는 인덱싱되지 않습니다.
예시
다음 예시 인덱스 정의는 whitespace
분석기를 사용하여 sample_mflix.movies 컬렉션의 title
필드에 대한 인덱스를 지정합니다. 클러스터에 컬렉션을 로드한 경우, Atlas UI Visual Editor 또는 JSON 편집기를 사용하여 예시 인덱스를 만들 수 있습니다. 원하는 구성 방법을 선택한 후 데이터베이스와 컬렉션을 선택합니다.
인덱스를 구성하려면 Refine Your Index을(를) 클릭합니다.
Field Mappings 섹션에서 Add Field 을 클릭하여 Add Field Mapping창을 엽니다.
Field Name 드롭다운 메뉴에서
title
을(를) 선택합니다.Customized Configuration를 클릭합니다.
Data Type 드롭다운을 클릭하고 아직 선택되지 않은 경우 String을(를) 선택합니다.
String Properties을 확장하고 다음과 같이 변경합니다:
인덱스 분석기
드롭다운 메뉴에서
lucene.whitespace
을(를) 선택합니다.검색 분석기
드롭다운 메뉴에서
lucene.whitespace
을(를) 선택합니다.인덱스 옵션
기본값
offsets
을(를) 사용합니다.Store
기본값
true
을(를) 사용합니다.위 내용 무시
기본 설정을 유지합니다.
규범
기본값
include
을(를) 사용합니다.Add를 클릭합니다.
Save Changes를 클릭합니다.
Create Search Index를 클릭합니다.
기본 인덱스 정의를 다음 인덱스 정의로 바꾸세요.
{ "mappings": { "fields": { "title": { "type": "string", "analyzer": "lucene.whitespace", "searchAnalyzer": "lucene.whitespace" } } } } Next를 클릭합니다.
Create Search Index를 클릭합니다.
다음 쿼리는 title
필드에서 Lion's
이라는 용어를 검색합니다.
db.movies.aggregate([ { "$search": { "text": { "query": "Lion's", "path": "title" } } }, { "$project": { "_id": 0, "title": 1 } } ])
[ { title: 'Lion's Den' }, { title: 'The Lion's Mouth Opens' } ]
Atlas Search는 lucene.whitespace
분석기를 사용하여 title
필드의 텍스트에 대해 다음을 수행하여 이러한 문서를 반환합니다.
텍스트의 원래 대소문자를 유지합니다.
공백 문자를 찾을 때마다 텍스트를 토큰으로 나눕니다.
다음 표는 공백 분석기, 단순 분석기 및 키워드 분석기를 사용하여 Atlas Search가 결과의 문서에 대해 생성하는 토큰(검색 가능한 용어)을 보여줍니다.
제목 | 공백 분석기 토큰 | 간단한 분석기 토큰 | 키워드 분석기 토큰 |
---|---|---|---|
|
|
|
|
|
|
|
|
whitespace
분석기를 사용하는 인덱스는 대소문자를 구분합니다. 따라서 Atlas Search는 쿼리 용어 Lion's
를 whitespace
분석기에서 생성된 토큰 Lion's
과 일치시킬 수 있습니다.