db.collection.distinct()
定义
db.collection.distinct(field, query, options)
带驱动程序的 MongoDB
本页面提供
mongosh
方法的相关信息。要查看 MongoDB 驱动程序中的等效方法,请参阅您的编程语言的相应页面:查找单个集合或视图中指定字段的非重复值,并以数组形式返回结果。
兼容性
此方法可用于以下环境中托管的部署:
MongoDB Atlas:用于云中 MongoDB 部署的完全托管服务
重要
此命令在 M 0 、 M 2和 M 5集群中提供有限支持。 有关更多信息,请参阅不支持的命令。
MongoDB Enterprise:基于订阅、自我管理的 MongoDB 版本
MongoDB Community:源代码可用、免费使用且可自行管理的 MongoDB 版本
语法
该方法采用以下参数:
Parameter | 类型 | 说明 |
---|---|---|
field | 字符串 | 要针对该字段返回非重复值。 |
query | 文档 | 指定要从中检索非重复值的文档的查询。 |
options | 文档 | 可选。指定选项的文档。请参阅选项。 |
注意
结果不得大于最大 BSON 大小。如果您的结果超出最大 BSON 大小,请使用聚合管道通过 $group
操作符检索非重复值,如使用聚合管道检索非重复值中所述。
下图是一个 db.collection.distinct()
调用示例。
选项
{ collation: <document> }
字段 | 类型 | 说明 | ||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|
collation | 文档 | 可选。 指定用于操作的排序规则。 排序规则允许用户为字符串比较指定特定于语言的规则,例如字母大小写和重音符号规则。 排序规则选项的语法如下:
指定排序规则时, 如果未指定排序规则,但集合具有默认排序规则(请参阅 如果没有为收集或操作指定排序规则,MongoDB 将使用先前版本中使用的简单二进制比较来进行字符串比较。 您不能为一个操作指定多个排序规则。例如,您不能为每个字段指定不同的排序规则,或者如果执行带排序的查找,则不能使用一种排序规则进行查找而另一种排序规则进行排序。 |
行为
对于时间序列集合, distinct
命令无法有效利用索引。相反,使用 $group
聚合按不同的值对文档进行分组。有关详细信息,请参阅时间序列限制。
数组字段
如果指定的 field
值是数组,则 db.collection.distinct()
将数组的每个元素视为一个单独的值。
例如,如果某一字段的值为 [ 1, [1], 1 ]
,则 db.collection.distinct()
会将 1
、[1]
和 1
视为不同的值。
有关示例,请参阅为数组字段返回不同值。
索引使用
在可能的情况下,db.collection.distinct()
操作可以使用索引。
索引还可以涵盖 db.collection.distinct()
操作。有关索引涵盖的查询的详细信息,请参阅涵盖的查询。
事务
如要在事务中执行不同的操作:
对于未分片集合,您可以使用
db.collection.distinct()
方法/distinct
命令以及带有$group
阶段的聚合管道。对于分片集合,不能使用
db.collection.distinct()
方法或distinct
命令。
重要
在大多数情况下,与单文档写入操作相比,分布式事务会产生更高的性能成本,并且分布式事务的可用性不应取代有效的模式设计。在许多情况下,非规范化数据模型(嵌入式文档和数组)仍然是数据和使用案例的最佳选择。换言之,对于许多场景,适当的数据建模将最大限度地减少对分布式事务的需求。
有关其他事务使用注意事项(如运行时间限制和 oplog 大小限制),另请参阅生产注意事项。
客户端断开连接
从 MongoDB 4.2 开始,如果在操作完成之前,发出 db.collection.distinct()
的客户端断开连接,MongoDB 将使用killOp
将 db.collection.distinct()
标记为终止。
副本集节点状态限制
要在副本集成员上运行,distinct
操作需要成员处于 PRIMARY
或 SECONDARY
状态。如果节点处于其他状态,如 STARTUP2
,则操作错误。
示例
这些示例使用包含以下文档的 inventory
集合:
{ "_id": 1, "dept": "A", "item": { "sku": "111", "color": "red" }, "sizes": [ "S", "M" ] } { "_id": 2, "dept": "A", "item": { "sku": "111", "color": "blue" }, "sizes": [ "M", "L" ] } { "_id": 3, "dept": "B", "item": { "sku": "222", "color": "blue" }, "sizes": "S" } { "_id": 4, "dept": "A", "item": { "sku": "333", "color": "black" }, "sizes": [ "S" ] }
返回字段的非重复值
以下示例将返回 inventory
集合的所有文档中字段 dept
的不同值:
db.inventory.distinct( "dept" )
该方法返回以下不同 dept
值的数组:
[ "A", "B" ]
返回嵌入式字段的非重复值
以下示例针对 inventory
集合的所有文档,从中返回嵌入 item
字段中的字段 sku
的非重复值:
db.inventory.distinct( "item.sku" )
该方法返回以下不同 sku
值的数组:
[ "111", "222", "333" ]
返回数组字段的非重复值
以下示例将返回 inventory
集合的所有文档中字段 sizes
的不同值:
db.inventory.distinct( "sizes" )
该方法返回以下不同 sizes
值的数组:
[ "M", "S", "L" ]
有关 distinct()
和数组字段的信息,请参阅行为一节。
使用以下项指定查询: distinct
对于 dept
等于 "A"
的文档,以下示例从中返回嵌入 item
字段中的字段 sku
的非重复值:
db.inventory.distinct( "item.sku", { dept: "A" } )
该方法返回以下不同 sku
值的数组:
[ "111", "333" ]
指定排序规则
排序规则允许用户为字符串比较指定特定于语言的规则,例如字母大小写和重音符号规则。
集合 myColl
包含以下文档:
{ _id: 1, category: "café", status: "A" } { _id: 2, category: "cafe", status: "a" } { _id: 3, category: "cafE", status: "a" }
以下聚合操作包括排序规则选项:
db.myColl.distinct( "category", {}, { collation: { locale: "fr", strength: 1 } } )
有关排序规则字段的说明,请参阅排序规则文档。