Docs 主页

/ /

聚合(Aggregation)

Docs 主页

/ /

distinct

此版本的文档已存档，不再提供支持。要升级5.0部署，请参阅 MongoDB 6.0升级程序。

定义

distinct: 查找单个集合中指定字段的不同值。distinct 返回一个文档，其中包含一个由非重复值组成的数组。返回文档还包含一份嵌入式文档，其中列出了查询统计数据和查询计划。
提示
在mongosh中，该命令也运行通过 db.collection.distinct()辅助方法运行。
辅助方法对 mongosh 用户来说很方便，但它们返回的信息级别可能与数据库命令不同。如果不追求方便或需要额外的返回字段，请使用数据库命令。

兼容性

此命令可用于以下环境中托管的部署：

MongoDB Atlas：用于云中 MongoDB 部署的完全托管服务

重要

此命令在 M 0 、 M 2和 M 5集群中提供有限支持。有关更多信息，请参阅不支持的命令。

MongoDB Enterprise：基于订阅、自我管理的 MongoDB 版本
MongoDB Community：源代码可用、免费使用且可自行管理的 MongoDB 版本

语法

该命令具有以下语法：

{
   distinct: "<collection>",
   key: "<field>",
   query: <query>,
   readConcern: <read concern document>,
   collation: <collation document>,
   comment: <any>
}

该命令包含以下字段：

字段

类型

说明

distinct

字符串

要查询不同值的集合名称。

key

字符串

要针对该字段返回非重复值。

query

文档

可选。指定要从中检索非重复值的文档的查询。

readConcern

文档

可选。指定读关注。

readConcern 选项的语法如下：readConcern: { level: <value> }

可能的读关注级别是：

"local"这是针对主节点和从节点的读操作的默认读关注级别。
"available"。可用于对主节点和从节点执行读取操作。对于主节点和非分片从节点，"available" 行为与 "local" 相同。查询会返回实例的最新数据。
"majority" 。适用于使用 WiredTiger 存储引擎的副本集。
"linearizable"。仅适用于 primary 的读取操作。

有关读关注级别的更多信息，请参阅读关注级别。

collation

文档

可选。

指定用于操作的排序规则。

排序规则允许用户为字符串比较指定特定于语言的规则，例如字母大小写和重音符号规则。

排序规则选项的语法如下：

collation: {
   locale: <string>,
   caseLevel: <boolean>,
   caseFirst: <string>,
   strength: <int>,
   numericOrdering: <boolean>,
   alternate: <string>,
   maxVariable: <string>,
   backwards: <boolean>
}

指定排序规则时，locale 字段为必填字段；所有其他排序规则字段均为可选字段。有关字段的说明，请参阅排序规则文档。

如果未指定排序规则，但集合具有默认排序规则（请参阅 db.createCollection()），则操作将使用为集合指定的排序规则。

如果没有为收集或操作指定排序规则，MongoDB 将使用先前版本中使用的简单二进制比较来进行字符串比较。

您不能为一个操作指定多个排序规则。例如，您不能为每个字段指定不同的排序规则，或者如果执行带排序的查找，则不能使用一种排序规则进行查找而另一种排序规则进行排序。

版本 3.4 中的新增功能。

comment

any

可选。用户提供的待附加到该命令的注释。设置后，该注释将与该命令的记录一起出现在以下位置：

mongod 日志消息，位于 attr.command.cursor.comment 字段中。
command.comment 字段中的数据库分析器输出。
currentOp 输出，在 command.comment 字段。

注释可以是任何有效的 BSON 类型（字符串、整型、对象、数组等）。

注意

结果不得大于最大 BSON 大小。如果您的结果超出最大 BSON 大小，请使用聚合管道通过 $group 操作符检索非重复值，如使用聚合管道检索非重复值中所述。

MongoDB 还为 distinct 命令提供 shell 包装器方法 db.collection.distinct()。此外，许多 MongoDB 驱动程序都提供包装器方法。请参阅具体的驱动程序文档。

行为

在分片集群中，distinct 命令可能会返回孤立文档。

对于时间序列集合， distinct 命令无法有效利用索引。相反，使用 $group 聚合按不同的值对文档进行分组。有关详细信息，请参阅时间序列限制。

数组字段

如果指定的 field 值是数组，则 distinct 将数组的每个元素视为一个单独的值。

例如，如果某一字段的值为 [ 1, [1], 1 ]，则 distinct 会将 1、[1] 和 1 视为不同的值。

有关示例，请参阅为数组字段返回不同值。

索引使用

在可能的情况下，distinct 操作可以使用索引。

索引还可以涵盖 distinct 操作。有关索引涵盖的查询的详细信息，请参阅涵盖的查询。

事务

如要在事务中执行不同的操作：

对于未分片的集合，可以使用 db.collection.distinct() 方法 / distinct 命令以及具有 $group 阶段的聚合管道。
对于分片集合，不能使用 db.collection.distinct() 方法或 distinct 命令。
要找到分片集合的不同值，请改用带有 $group 阶段的聚合管道。有关详细信息，请参阅去重操作。

重要

在大多数情况下，与单文档写入操作相比，分布式事务会产生更高的性能成本，并且分布式事务的可用性不应取代有效的模式设计。在许多情况下，非规范化数据模型（嵌入式文档和数组）仍然是数据和使用案例的最佳选择。换言之，对于许多场景，适当的数据建模将最大限度地减少对分布式事务的需求。

有关其他事务使用注意事项（如运行时间限制和 oplog 大小限制），另请参阅生产注意事项。

客户端断开连接

从 MongoDB 4.2 开始，如果在操作完成之前，发出 distinct 的客户端断开连接，MongoDB 将使用killOp 将 distinct 标记为终止。

副本集节点状态限制

若要在副本集节点上运行，distinct 操作要求该节点处于 PRIMARY 或 SECONDARY 状态。如果该节点处于其他状态，如 STARTUP2，则操作错误。

示例

这些示例使用包含以下文档的 inventory 集合：

{ "_id": 1, "dept": "A", "item": { "sku": "111", "color": "red" }, "sizes": [ "S", "M" ] }
{ "_id": 2, "dept": "A", "item": { "sku": "111", "color": "blue" }, "sizes": [ "M", "L" ] }
{ "_id": 3, "dept": "B", "item": { "sku": "222", "color": "blue" }, "sizes": "S" }
{ "_id": 4, "dept": "A", "item": { "sku": "333", "color": "black" }, "sizes": [ "S" ] }

返回字段的非重复值

以下示例将返回 inventory 集合的所有文档中字段 dept 的不同值：

db.runCommand ( { distinct: "inventory", key: "dept" } )

该命令返回一个文档，其中包含名为values的字段，其中包含不同的 dept 值：

{
   "values" : [ "A", "B" ],
   "ok" : 1
}

返回嵌入式字段的非重复值

以下示例针对 inventory 集合的所有文档，从中返回嵌入 item 字段中的字段 sku 的非重复值：

db.runCommand ( { distinct: "inventory", key: "item.sku" } )

该命令返回一个文档，其中包含名为values的字段，其中包含不同的 sku 值：

{
  "values" : [ "111", "222", "333" ],
  "ok" : 1
}

提示

用于获取有关访问嵌入式文档内字段的信息的点符号

返回数组字段的非重复值

以下示例将返回 inventory 集合的所有文档中字段 sizes 的不同值：

db.runCommand ( { distinct: "inventory", key: "sizes" } )

该命令返回一个文档，其中包含名为values的字段，其中包含不同的 sizes 值：

{
  "values" : [ "M", "S", "L" ],
  "ok" : 1
}

有关 distinct 和数组字段的信息，请参阅行为一节。

使用以下项指定查询： `distinct`

对于 dept 等于 "A" 的文档，以下示例从中返回嵌入 item 字段中的字段 sku 的非重复值：

db.runCommand ( { distinct: "inventory", key: "item.sku", query: { dept: "A"} } )

该命令返回一个文档，其中包含名为values的字段，其中包含不同的 sku 值：

{
  "values" : [ "111", "333" ],
  "ok" : 1
}

指定排序规则

版本 3.4 中的新增功能。

排序规则允许用户为字符串比较指定特定于语言的规则，例如字母大小写和重音符号规则。

集合 myColl 包含以下文档：

{ _id: 1, category: "café", status: "A" }
{ _id: 2, category: "cafe", status: "a" }
{ _id: 3, category: "cafE", status: "a" }

以下聚合操作包括排序规则选项：

db.runCommand(
   {
      distinct: "myColl",
      key: "category",
      collation: { locale: "fr", strength: 1 }
   }
)

有关排序规则字段的说明，请参阅排序规则文档。

覆盖默认读关注

若要覆盖 "local" 的默认读取关注级别，请使用 readConcern 选项。

对副本集执行以下操作可以指定读关注 "majority"，以读取确认已写入大多数节点的数据的最新副本。

注意

无论读关注级别如何，节点上的最新数据可能无法反映系统中数据的最新版本。

db.runCommand(
   {
     distinct: "restaurants",
     key: "rating",
     query: { cuisine: "italian" },
     readConcern: { level: "majority" }
   }
)

为确保单个线程可以读取自己的写入内容，请对副本集的主节点使用 "majority" 读关注和 "majority" 写关注。

后退

数数

来年

MapReduce

定义

提示

兼容性

重要

语法

注意

行为

数组字段

索引使用

事务

重要

客户端断开连接

副本集节点状态限制

示例

返回字段的非重复值

返回嵌入式字段的非重复值

提示

返回数组字段的非重复值

使用以下项指定查询： distinct

指定排序规则

覆盖默认读关注

注意

使用以下项指定查询： `distinct`