Analisador de espaço em branco
O analisador whitespace
divide o texto em termos pesquisáveis (tokens) onde quer que encontre um caractere de espaço em branco. Todo o texto é deixado em sua caixa original.
Você pode ver os tokens que o analisador whitespace
cria para uma string estática integrada na interface de usuário do Atlas Visual Editor quando você usa Refine Your Index. A seção Index
Configurations exibe o índice e os tokens de pesquisa que o analisador whitespace
cria se você expandir View text
analysis of your selected index configuration para ajudá-lo a selecionar o analisador a ser usado em seu índice.
Importante
O Atlas Search não indexará campos de string em que os tokens do analisador excedam 32766 bytes de tamanho. Se estiver usando o analisador de palavra-chave, os campos de string que excederem 32766 bytes não serão indexados.
Exemplo
A seguinte definição de índice de exemplo especifica um índice no campo title
na coleção sample_mflix.movies utilizando o analisador whitespace
. Se você carregou a coleção no cluster, poderá criar o índice de exemplo usando o Editor Visual da Interface do Usuário do Atlas ou o Editor JSON. Depois de selecionar seu método de configuração preferencial, selecione o banco de dados e a coleção.
Clique em Refine Your Index para configurar seu índice.
Na seção Field Mappings, clique em Add Field para abrir a janela Add Field Mapping.
Selecione
title
no menu suspenso Field Name.Clique em Customized Configuration.
Clique no menu suspenso Data Type e selecione String se ainda não estiver selecionado.
Expanda o String Properties e faça as seguintes alterações:
Analisador de índice
Selecione
lucene.whitespace
no menu suspenso.Analisador de pesquisa
Selecione
lucene.whitespace
no menu suspenso.Opções de índice
Use o
offsets
padrão.Store
Use o
true
padrão.Ignorar acima
Manter a configuração padrão.
Normas
Use o
include
padrão.Clique em Add.
Clique em Save Changes.
Clique em Create Search Index.
Substitua a definição de índice padrão pela seguinte definição de índice.
{ "mappings": { "fields": { "title": { "type": "string", "analyzer": "lucene.whitespace", "searchAnalyzer": "lucene.whitespace" } } } } Clique em Next.
Clique em Create Search Index.
A seguinte consulta procura o termo Lion's
no campo title
.
db.movies.aggregate([ { "$search": { "text": { "query": "Lion's", "path": "title" } } }, { "$project": { "_id": 0, "title": 1 } } ])
[ { title: 'Lion's Den' }, { title: 'The Lion's Mouth Opens' } ]
O Atlas Search retorna esses documentos fazendo o seguinte para o texto no campo title
usando o analisador lucene.whitespace
:
Mantenha as letras maiúsculas e minúsculas originais do texto.
Divida o texto em tokens onde quer que ele encontre um caractere de espaço em branco.
A tabela a seguir mostra os tokens (termos pesquisáveis) que o Atlas Search cria usando o analisador de espaço em branco e, por outro lado, o analisador simples e o analisador de palavras-chave para os documentos nos resultados:
Título | Tokens do analisador de espaço em branco | Tokens de analisador simples | Tokens do analisador de palavras-chave |
---|---|---|---|
|
|
|
|
|
|
|
|
O índice que utiliza o analisador whitespace
é sensível a maiúsculas e minúsculas. Portanto, o Atlas Search é capaz de corresponder o termo de query Lion's
ao token Lion's
criado pelo analisador whitespace
.