Explore o novo chatbot do Developer Center! O MongoDB AI chatbot pode ser acessado na parte superior da sua navegação para responder a todas as suas perguntas sobre o MongoDB .

Desenvolvedor do MongoDB
Central de desenvolvedor do MongoDBchevron-right

Dominando a indexação para correspondências perfeitas de query

7 min • Publicado em 08 de novembro 2023
Ícone do FacebookÍcone do Twitterícone do linkedin
Avalie esse Vídeo
star-empty
star-empty
star-empty
star-empty
star-empty
Pesquisar
00:00:00Introdução à indexação
00:00:57Configuração do índice e requisitos do Atlas Search
00:01:42document model e estrutura de índice
00:02:38Sincronização do índice do Atlas Search
00:03:31Noções básicas sobre o índice invertido
00:04:38Analisadores e configuração de índice
00:05:47Demonstração do Índice Invertido e Analisadores
00:07:00Efeitos de analisadores básicos no Atlas Search
00:08:31Conclusão e Importância da Configuração do Índice
00:09:52Visualização do próximo tópico: Pesquisando
00:10:27Considerações deencerramento e chamada para inscrição
O tema principal do vídeo é a importância da configuração do índice no Atlas Search do MongoDB e como ela afeta a capacidade de pesquisa e a eficácia das queries.
} Pontos-chave
  • A configuração do índice é fundamental para otimizar a funcionalidade do Atlas Search.
  • O aggregation pipeline stage `$Atlas Search` é central para os recursos de Atlas Search do MongoDB.
  • Compreender os tipos de dados e queries é essencial para uma indexação eficaz.
  • OMongoDB do se alinha bem às estruturas de índice, facilitando as pesquisas.document model
  • As alterações na configuração do índice trigger uma reindexação completa do conteúdo.
  • O Atlas Search usa um índice invertido para conteúdo de texto completo, com vários analisadores que afetam a capacidade de pesquisa e a relevância.
Todos os vídeos do MongoDB

Transcrição completa do vídeo
este é o terceiro estágio da Temporada 1 A localização da indexação está intimamente ligada à sua configuração de índice com o estágio do pipeline de agregação do Atlas Search, então é muito importante se ater à configuração que você tem e garantir que ela atenda às necessidades de seus requisitos de pesquisa um pouco de idioma e variações de uh e o tipo de imprecisão que você deseja em termos de correspondência uh você tem sinônimos de domínio e todos esses tipos de coisas uh relacionadas ao tipo de dados que você tem e então os tipos de queries que você vai fazer um problema em relação ao dólar estágio de agregação do Atlas Search uh muito bem o document model se adapta bem à estrutura do índice então quando você faz uma o Atlas Search com dólar o que você está recuperando de volta o que o que corresponde os documentos da sua coleção original e uh no índice do Lucene e o índice sob as cobertas do Atlas Search também são chamados de documentos e têm campos assim como os documentos que você tem uh em seu banco de dados do Atlas e, devido a esse mapeamento muito bom uh, há a capacidade de especificar a configuração que você deseja por campo e dizer como deseja que esses campos sejam pesquisados ou facetados ou uh, às vezes uh, como eles são classificáveis um quando você adiciona quando você cria um índice do Atlas Search, como dissemos no início do Início Rápido, há um processo de sincronização automática que está ocorrendo para que quaisquer alterações em seu conteúdo também sejam refletidas no próprio índice É importante observar que qualquer alteração na configuração do índice em si causa uh uma reindexação completa de todo o seu conteúdo e uh isso acontece uh em paralelo ao seu índice ativo para que uh as coisas permaneçam pesquisáveis uh e as coisas sejam reindexadas com o novo reindexo estrutura e e apontar para os novos nós quando isso acontecer umm então, considerando tudo isso, vamos falar sobre uh a estrutura do índice e o que é necessário para configurar essa estrutura do índice então sob a cobertura s do Atlas Search é o que é chamado de índice invertido que é a estrutura de dados do conteúdo de texto completo para o conteúdo textual uh que está sendo mapeado do seu banco de dados para o Atlas Search sob as cobertas novamente este é um índice do Lucene no conteúdo textual produz uma estrutura de dados chamada um índice invertido e aqui está uma ilustra obtemos o próximo documento uh e mais texto ponto ponto ponto e mais texto esse analisador uh configuração o analisador padrão, que é o padrão, dividirá o texto em tokens e termos e estes se tornarão as unidades pesquisáveis de índice invertido para que a configuração do analisador seja a chave para o texto em seu conteúdo é pesquisável quais são as palavras extraídas do seu conteúdo são os caracteres especiais uh como eles são tratados como é o caso e manipulado H maiúsculas vai para um H minúsculo aqui o apóstrofo s permaneceram usando esta configuração de analisador específica agora vamos indexar mais um documento e ver como essa estrutura de índice invertida fica agora então o terceiro documento e mais algum texto então há algumas palavras sobrepostas e mais e alguns e texto para que você possa ver aqui em uh o índice invertido O que é chamado de parte da lista de postagem do índice invertido são os documentos associados a cada termo que foi extraído durante o processo de análise e, novamente, esses são os pesquisáveis unidades e alterar o analisador que você está usando para seus campos específicos permite que você ajuste novamente a capacidade de pesquisa e, às vezes, até a relevância dos resultados que são retornados, então agora vamos dar uma olhada em vários efeitos uh do analisador básico que são construído no Atlas Search então aqui vamos percorrer vários analisadores um Vamos ampliar um pouco isso aqui para que possamos ver os termos at são extraídos aqui então usando o analisador padrão do uh Atlas Search é assim que o texto é dividido para aqui está um texto e neste exemplo vamos continuar usando aqui um pouco de texto aqui está algum texto usando o analisador simples então isto é chamado Lucene Dost standard para o primeiro Lucene do simple para o segundo aqui e depois uh o analisador de espaço branco que quebra o texto em caracteres de espaço Wh, mas deixa todo o resto intacto, maiúsculas e minúsculas e assim por diante, e você pode ver aqui no analisador simples o apóstrofo s uh foi usado como delimitador e manteve o S como um token separado do analisador de inglês, então este uh aplica algum outro fistic que não é bem aparente aqui nesses termos específicos, exceto o apóstrofo s foi removido então uh plurais ou contrações em dessa forma, ele é removido para que haja uma unidade pesquisável e haja um analisador de palavras-chave esse é importante se você souber que manterá o texto exatamente como está e usará uh isso como um tipo de correspondência exata Atlas Search ou talvez um tipo de prefixo Atlas Search um para que o analisador de palavras-chave mantenha o texto exatamente como está e é EX indexado no índice invertido como um único termo e, finalmente, uh há um tipo de campo uh de preenchimento automático no Atlas Pesquise e quando você ativar isso, há algumas opções e essa é apenas uma configuração dela em que ele engrama o texto um após o token, então aqui algum texto é tokenizado em tokens separados três tokens diferentes aqui então ele usa engramas para uh indexe todas as subpartes do texto até um determinado tamanho mínimo e máximo de gramas e com esse índice invertido e demonstração do analyzer a importância da configuração do índice torna-se clara qual é o seu índice é o que você pode encontrar e como você pode encontrá-lo do básico separação de palavras e normalização da distinção entre maiúsculas e minúsculas para derivação específica do idioma e nível de caracteres a configuração do índice amrs fornece as partes necessárias para o próximo Tópico em nossa série pesquisando assim s fique atento se inscreva para receber notificações dos nossos lançamentos em vídeo

Ícone do FacebookÍcone do Twitterícone do linkedin
Avalie esse Vídeo
star-empty
star-empty
star-empty
star-empty
star-empty
{Parte de uma série
A cena do Atlas Search!
Próximo
Operadores de consulta e controles de relevância para pesquisas precisas
Continuar

Mais nesta série
Relacionado
Vídeo

A cena do Atlas Search: Temporada 1


Sep 11, 2024 | 2 min