문서 메뉴
문서 홈
/
MongoDB 아틀라스
/ / / /

단순 분석기

simple 분석기는 공백, 구두점 또는 하나 이상의 숫자와 같은 문자가 아닌 문자가 발견될 때마다 텍스트를 검색 가능한 텀(토큰)로 나눕니다. 모든 텍스트를 소문자로 변환합니다.

중요

Atlas Search는 크기가 32766바이트를 초과하는 문자열 필드를 인덱싱하지 않습니다.

다음 예제 인덱스 정의는 simple 분석기를 사용하여 sample_mflix.movies 컬렉션의 title 필드에 대한 인덱스를 지정합니다. 클러스터에 컬렉션을 로드한 경우, Atlas UI 비주얼 편집기 또는 JSON 편집기를 사용하여 예제 인덱스를 만들 수 있습니다. 원하는 구성 방법을 선택한 후 데이터베이스와 컬렉션을 선택합니다.

다음 쿼리는 title 필드에서 lion 라는 용어를 검색하여 출력을 5개의 결과로 제한합니다.

1db.movies.aggregate([
2 {
3 "$search": {
4 "text": {
5 "query": "lion",
6 "path": "title"
7 }
8 }
9 },
10 {
11 "$limit": 5
12 },
13 {
14 "$project": {
15 "_id": 0,
16 "title": 1
17 }
18 }
19])
[
{ title: 'White Lion' },
{ title: 'The Lion King' },
{ title: 'The Lion King 1 1/2' },
{ title: 'The Lion King 1 1/2' },
{ title: 'Lion's Den' },
]

Atlas Search는 lucene.simple 분석기를 사용하여 title 필드의 텍스트에 대해 다음을 수행하여 이러한 문서를 반환합니다.

  • 텍스트를 소문자로 변환합니다.

  • 문자가 아닌 문자가 있는 곳마다 텍스트를 나누어 별도의 토큰을 만듭니다.

다음 표는 Atlas Search가 단순 분석기 와 반대로 결과의 문서에 대해 표준 분석기공백 분석기 를 사용하여 생성하는 토큰을 보여줍니다.

제목
간단한 분석기 토큰
표준 분석기 토큰
공백 분석기 토큰
White Lion
white, lion
white, lion
White, Lion
The Lion King
the , lion , king
the , lion , king
The , Lion , King
The Lion King 1 1/2
the , lion , king
the, lion, king, 1, 1, 2
The , Lion , King , 1 , 1/2
Lion's Den
lion , s , den
lion's, den
Lion's, Den

simple 분석기가 쿼리 용어 lion 와 일치하는 lion 에 대한 별도의 토큰을 생성하기 때문에 Atlas Search는 결과에 Lion's Den 문서를 반환합니다. 반대로 표준 분석기 또는 공백 분석기 를 사용하여 필드를 인덱싱하는 경우 Atlas Search는 쿼리 결과에 있는 일부 문서를 반환하지만 Lion's Den 는 반환하지 않습니다. 이러한 분석기가 lion'sLion's 토큰을 생성하기 때문입니다. lion 에 대한 토큰을 생성하지 마세요.

← 스탠다드
공백 →