“文档” 菜单
文档首页
/
MongoDB 阿特拉斯
/ / / /

空格分析器

只要找到空格字符, whitespace分析器就会将文本分割为可搜索术语(词元)。它将所有文本保留为原始字母大小写。

重要

Atlas Search 不会对大小超过 32766 字节的字符串字段进行索引。

以下示例索引定义使用whitespace分析器指定 sample_mflix.movies集合中的title字段上的索引。如果已将集合加载到集群上,则可以使用 Atlas 用户界面可视化编辑器或 JSON编辑器创建示例索引。选择首选配置方法后,选择数据库和集合。

以下查询在title字段中搜索词语Lion's

db.movies.aggregate([
{
"$search": {
"text": {
"query": "Lion's",
"path": "title"
}
}
},
{
"$project": {
"_id": 0,
"title": 1
}
}
])
[
{ title: 'Lion's Den' },
{ title: 'The Lion's Mouth Opens' }
]

Atlas Search 使用lucene.whitespace分析器对title字段中的文本执行以下操作,从而返回这些文档:

  • 保留文本的原始字母大小写。

  • 在找到空白字符的地方将文本分割为词元。

下表显示了 Atlas Search 使用空格分析器以及简单分析器关键字分析器为结果中的文档创建的词元(可搜索词语):

标题
空白分析器令牌
简单分析器词元
关键字分析器词元
Lion's Den
Lion'sDen
lionsden
Lion's Den
The Lion's Mouth Opens
TheLion'sMouthOpens
thelionsmouthopens
The Lion's Mouth Opens

使用whitespace分析器的索引区分大小写。 因此,Atlas Search 能够将查询词Lion's Lion'swhitespace 分析器创建的词元 进行匹配。

← simple