使用分析器处理数据
您可以控制 Atlas Search 如何使用分析器 将 string
字段内容转换为可搜索词语。分析器是将分词器(从文本中提取词元)与定义的筛选器结合使用的策略。Atlas Search 将筛选器应用于词元以创建可索引词语,从而纠正标点符号、大小写、语气词等方面的差异。
要控制 Atlas Search 如何创建搜索词,请在 索引定义中使用 Atlas Search 分析器。您可以在创建索引和/或执行查询时指定分析器。
分析器
Atlas Search 提供以下内置分析器:
分析器 | 说明 |
---|---|
将默认分析器用于所有 Atlas Search 索引和查询。 | |
遇到非字母字符时,将文本分割为可搜索词语。 | |
遇到空白字符时,将文本分割为可搜索词语。 | |
提供一组语言特定的文本分析器。 | |
将文本字段作为单个词语进行索引。 |
您还可以创建自己的自定义分析器。您可以使用多分析器指定备用的分析器。
如果您未指定分析器,则 MongoDB 使用默认标准分析器。
要了解有关分析器的更多信息,请参阅 MongoDB 开发者中心的分析分析器,为应用构建正确的搜索索引。
规范化器
规范化器仅在分析结束时生成一个词元。您只能在 Atlas Search token 类型的字段定义中配置规范化器。Atlas Search 提供以下规范化器:
规范化器 | 说明 |
---|---|
lowercase | 将字符串字段中的文本转换为小写,并为整个字符串创建单个词元。 |
none | 不执行任何转换,但仍创建单个词元。 |