空格分析器
只要找到空格字符, whitespace
分析器就会将文本分割为可搜索术语(词元)。它将所有文本保留为原始字母大小写。
重要
Atlas Search 不会对大小超过 32766 字节的字符串字段进行索引。
例子
以下示例索引定义使用whitespace
分析器指定 sample_mflix.movies集合中的title
字段上的索引。如果已将集合加载到集群上,则可以使用 Atlas 用户界面可视化编辑器或 JSON编辑器创建示例索引。选择首选配置方法后,选择数据库和集合。
以下查询在title
字段中搜索词语Lion's
。
db.movies.aggregate([ { "$search": { "text": { "query": "Lion's", "path": "title" } } }, { "$project": { "_id": 0, "title": 1 } } ])
[ { title: 'Lion's Den' }, { title: 'The Lion's Mouth Opens' } ]
Atlas Search 使用lucene.whitespace
分析器对title
字段中的文本执行以下操作,从而返回这些文档:
保留文本的原始字母大小写。
在找到空白字符的地方将文本分割为词元。
下表显示了 Atlas Search 使用空格分析器以及简单分析器和关键字分析器为结果中的文档创建的词元(可搜索词语):
标题 | 空白分析器令牌 | 简单分析器词元 | 关键字分析器词元 |
---|---|---|---|
Lion's Den | Lion's , Den | lion , s , den | Lion's Den |
The Lion's Mouth Opens | The , Lion's , Mouth , Opens | the , lion , s , mouth , opens | The Lion's Mouth Opens |
使用whitespace
分析器的索引区分大小写。 因此,Atlas Search 能够将查询词Lion's
Lion's
与whitespace
分析器创建的词元 进行匹配。