분석기로 데이터 처리
분석기를 사용하여 Atlas Search가 string
필드의 콘텐츠를 검색 가능한 용어로 변환하는 방법을 제어할 수 있습니다. 분석기는 텍스트에서 토큰을 추출하는 토크나이저와 사용자가 정의한 필터를 결합하는 정책입니다. Atlas Search는 토큰에 필터를 적용하여 구두점, 대문자, 필러 단어 등의 차이를 보정하는 인덱스 가능한 용어를 생성합니다.
Atlas Search가 검색어를 생성하는 방법을 제어하려면 인덱스 정의에서 Atlas Search 분석기를 사용하세요. 인덱스를 만들거나 쿼리를 실행할 때 또는 두 경우 모두에서 분석기를 지정할 수 있습니다.
분석기
Atlas Search는 다음과 같은 내장 분석기를 제공합니다.
분석기 | 설명 |
---|---|
모든 Atlas Search 인덱스 및 쿼리에 기본 분석기를 사용합니다. | |
문자가 아닌 문자를 발견할 때마다 텍스트를 검색 가능한 용어로 나눕니다. | |
공백 문자를 발견할 때마다 텍스트를 검색 가능한 용어로 나눕니다. | |
언어별 텍스트 분석기 세트를 제공합니다. | |
텍스트 필드를 단일 용어로 인덱싱합니다. |
사용자 지정 분석기를 만들 수도 있습니다. 다중 분석기를 사용하여 대체 분석기를 지정할 수 있습니다.
분석기를 지정하지 않으면 MongoDB는 기본 표준 분석기를 사용합니다.
분석기에 대해 자세히 알아보려면 MongoDB 개발자 센터에서 분석기를 분석하여 앱에 적합한 검색 인덱스 구축하기를 참조하세요.
정규화 도구
정규화 도구는 분석이 끝날 때 하나의 토큰만 생성합니다. 정규화 도구는 Atlas Search 토큰 유형에 대한 필드 정의에서만 구성할 수 있습니다. Atlas Search는 다음과 같은 정규화 도구를 제공합니다.
정규화 도구 | 설명 |
---|---|
| 문자열 필드의 텍스트를 소문자로 변환하고 전체 문자열에 대한 단일 토큰을 생성합니다. |
| 변환을 수행하지 않지만 여전히 단일 토큰을 생성합니다. |