Docs 菜单
Docs 主页
/ / /
Kotlin Sync 驱动程序

通过聚合转换数据

在此页面上

  • Overview
  • 比较聚合与查找操作
  • 限制
  • 聚合示例
  • 构建并执行聚合管道
  • 解释聚合
  • 更多信息
  • API 文档

在本指南中,您可以学习;了解如何使用Kotlin Sync驾驶员执行聚合操作

您可以使用聚合操作来进程MongoDB集合中的数据并返回计算结果。 MongoDB聚合框架是 Query API的一部分,以数据处理管道的概念为模型。 文档进入包含一个或多个阶段的管道,每个阶段都会转换文档以输出最终的聚合结果。

您可以将聚合操作视为类似于汽车工厂。 汽车工厂有一条装配线,其中包含配备专用工具的装配站,用于完成特定的工作,例如钻机和焊机。 毛坯零件进入工厂,然后装配线将其转换并组装成成品。

聚合管道是装配线,聚合阶段是装配站,操作符表达式则是专用工具。

您可以使用查找操作执行以下动作:

  • 选择要返回的文档

  • 选择要返回的字段

  • 对结果进行排序

您可以使用聚合操作执行以下动作:

  • 执行查找操作

  • 重命名字段

  • 计算字段

  • 汇总数据

  • 对值进行分组

应用聚合操作时存在以下限制:

  • 返回的文档不得违反 BSON 文档大小限制(16 兆字节)。

  • 默认,管道阶段的内存限制为100 MB。 您可以使用AggregateIterable类中的 allowDiskUse()方法来超出此限制。

重要

$graphLookup 异常

$graphLookup阶段有100 MB 的严格内存限制,并忽略allowDiskUse选项。

本部分中的示例使用Atlas示例数据集sample_restaurants数据库中的restaurants集合。 要学习;了解如何创建免费的MongoDB Atlas 群集并加载示例数据集,请参阅Atlas入门指南。

以下Kotlin数据类对此集合中的文档进行建模:

data class Restaurant(
val name: String,
val cuisine: String,
val borough: String
)

要对集合中的文档执行聚合,请将聚合阶段列表传递给aggregate()方法。

此示例输出纽约市每个行政区的面包店数量。 以下代码创建包含以下阶段的聚合管道:

  • $match阶段,用于过滤cuisine字段值为"Bakery"的文档。

  • $ 群组阶段按borough字段对匹配文档进行群组,从而为该字段的每个非重复值生成文档计数。

val pipeline = listOf(
Aggregates.match(Filters.eq(Restaurant::cuisine.name, "Bakery")),
Aggregates.group("\$borough", Accumulators.sum("count", 1))
)
val results = collection.aggregate<Document>(pipeline)
results.forEach { result ->
println(result)
}
Document{{_id=Bronx, count=71}}
Document{{_id=Manhattan, count=221}}
Document{{_id=Brooklyn, count=173}}
Document{{_id=Queens, count=204}}
Document{{_id=Staten Island, count=20}}
Document{{_id=Missing, count=2}}

提示

$group聚合阶段指定群组键时,请确保使用\字符对任何$字符进行转义。

要查看有关MongoDB如何执行操作的信息,可以在管道中包含$explain聚合阶段。 MongoDB解释操作时,会返回执行计划和性能统计信息。 执行计划是MongoDB完成操作的一种潜在方式。 当您指示MongoDB解释一个操作时,它会返回MongoDB为该操作选择的计划以及任何被拒绝的执行计划。

以下代码示例运行上一节所示的相同聚合,并添加$explain阶段以输出操作详细信息:

print(collection.aggregate(pipeline).explain())
{
"explainVersion": "2",
"queryPlanner": {
"namespace": "sample_restaurants.restaurants"
"indexFilterSet": false,
"parsedQuery": {
"cuisine": {"$eq": "Bakery"}
},
"queryHash": "865F14C3",
"planCacheKey": "0697561B",
"optimizedPipeline": true,
"maxIndexedOrSolutionsReached": false,
"maxIndexedAndSolutionsReached": false,
"maxScansToExplodeReached": false,
"winningPlan": { ... }
...
}
...
}

要查看表达式操作符的完整列表,请参阅MongoDB Server手册中的聚合操作符

要学习;了解如何组装聚合管道并查看示例,请参阅MongoDB Server手册中的聚合管道

要学习;了解有关创建管道阶段的更多信息,请参阅MongoDB Server手册中的聚合阶段

要学习;了解有关解释MongoDB操作的更多信息,请参阅MongoDB Server手册中的解释输出查询计划

有关使用Kotlin Sync驾驶员执行聚合操作的更多信息,请参阅以下API文档:

后退

Atlas Search和 Vector Search