Menu Docs
Página inicial do Docs
/
MongoDB Atlas
/ / / /

Analisador de espaço em branco

O analisador whitespace divide o texto em termos pesquisáveis (tokens) onde quer que encontre um caractere de espaço em branco. Todo o texto é deixado em sua caixa original.

Você pode ver os tokens que o analisador whitespace cria para uma string estática integrada na interface de usuário do Atlas Visual Editor quando você usa Refine Your Index. A seção Index Configurations exibe o índice e os tokens de pesquisa que o analisador whitespace cria se você expandir View text analysis of your selected index configuration para ajudá-lo a selecionar o analisador a ser usado em seu índice.

Importante

O Atlas Search não indexará campos de string em que os tokens do analisador excedam 32766 bytes de tamanho. Se estiver usando o analisador de palavra-chave, os campos de string que excederem 32766 bytes não serão indexados.

A seguinte definição de índice de exemplo especifica um índice no campo title na coleção sample_mflix.movies utilizando o analisador whitespace. Se você carregou a coleção no cluster, poderá criar o índice de exemplo usando o Editor Visual da Interface do Usuário do Atlas ou o Editor JSON. Depois de selecionar seu método de configuração preferencial, selecione o banco de dados e a coleção.

  1. Clique em Refine Your Index para configurar seu índice.

  2. Na seção Field Mappings, clique em Add Field para abrir a janela Add Field Mapping.

  3. Selecione title no menu suspenso Field Name.

  4. Clique em Customized Configuration.

  5. Clique no menu suspenso Data Type e selecione String se ainda não estiver selecionado.

  6. Expanda o String Properties e faça as seguintes alterações:

    Analisador de índice

    Selecione lucene.whitespace no menu suspenso.

    Analisador de pesquisa

    Selecione lucene.whitespace no menu suspenso.

    Opções de índice

    Use o offsets padrão.

    Store

    Use o true padrão.

    Ignorar acima

    Manter a configuração padrão.

    Normas

    Use o include padrão.

  7. Clique em Add.

  8. Clique em Save Changes.

  9. Clique em Create Search Index.

  1. Substitua a definição de índice padrão pela seguinte definição de índice.

    {
    "mappings": {
    "fields": {
    "title": {
    "type": "string",
    "analyzer": "lucene.whitespace",
    "searchAnalyzer": "lucene.whitespace"
    }
    }
    }
    }
  2. Clique em Next.

  3. Clique em Create Search Index.

A seguinte consulta procura o termo Lion's no campo title .

db.movies.aggregate([
{
"$search": {
"text": {
"query": "Lion's",
"path": "title"
}
}
},
{
"$project": {
"_id": 0,
"title": 1
}
}
])
[
{ title: 'Lion's Den' },
{ title: 'The Lion's Mouth Opens' }
]

O Atlas Search retorna esses documentos fazendo o seguinte para o texto no campo title usando o analisador lucene.whitespace :

  • Mantenha as letras maiúsculas e minúsculas originais do texto.

  • Divida o texto em tokens onde quer que ele encontre um caractere de espaço em branco.

A tabela a seguir mostra os tokens (termos pesquisáveis) que o Atlas Search cria usando o analisador de espaço em branco e, por outro lado, o analisador simples e o analisador de palavras-chave para os documentos nos resultados:

Título
Tokens do analisador de espaço em branco
Tokens de analisador simples
Tokens do analisador de palavras-chave

Lion's Den

Lion's, Den

lion, s , den

Lion's Den

The Lion's Mouth Opens

The, Lion's, Mouth, Opens

the, lion, s, mouth, opens

The Lion's Mouth Opens

O índice que utiliza o analisador whitespace é sensível a maiúsculas e minúsculas. Portanto, o Atlas Search é capaz de corresponder o termo de query Lion's ao token Lion's criado pelo analisador whitespace .

Voltar

simples