Docs 菜单
Docs 主页
/ / /
Scala
/

聚合框架

在此页面上

  • 先决条件
  • 连接到 MongoDB 部署
  • 执行聚合
  • 使用聚合表达式
  • 解释聚合

聚合管道是一个数据聚合框架,以数据处理管道的概念为模型。

要学习;了解有关聚合的更多信息,请参阅服务器手册中的聚合管道

您必须设置以下组件才能运行本指南中的代码示例:

  • 一个test.restaurants 集合,其中填充了来自restaurants.json 文档资产Github 中 文件的文档。

  • 以下 import 语句:

import org.mongodb.scala._
import org.mongodb.scala.model.Aggregates._
import org.mongodb.scala.model.Accumulators._
import org.mongodb.scala.model.Filters._
import org.mongodb.scala.model.Projections._

注意

本指南使用快速入门入门中所述的Observable隐式。

首先,连接到 MongoDB 部署,然后声明并定义MongoDatabaseMongoCollection实例。

以下代码连接到在端口27017上的localhost上运行的独立 MongoDB 部署。 然后,定义database变量以引用test数据库,并collection变量以引用restaurants集合:

val mongoClient: MongoClient = MongoClient()
val database: MongoDatabase = mongoClient.getDatabase("test")
val collection: MongoCollection[Document] = database.getCollection("restaurants")

要了解有关连接到 MongoDB 部署的更多信息,请参阅连接到 MongoDB教程。

要执行聚合,请将聚合阶段列表传递给MongoCollection.aggregate()方法。 驾驶员提供了Aggregates辅助类,其中包含聚合阶段的构建者器。

在此示例中,聚合管道执行以下任务:

  • 使用$match阶段筛选categories数组字段包含元素"Bakery"的文档。 该示例使用Aggregates.filter()构建$match阶段。

  • 使用$group阶段按stars字段对匹配文档进行群组,并累积每个不同的stars值的文档计数。 该示例使用Aggregates.group()构建$group阶段,并使用Accumulators.sum()构建累加器表达式。 对于在$group阶段使用的累加器表达式,驾驶员提供了Accumulators辅助类。

collection.aggregate(Seq(
Aggregates.filter(Filters.equal("categories", "Bakery")),
Aggregates.group("$stars", Accumulators.sum("count", 1))
)).printResults()

对于$group累加器表达式,驾驶员提供了Accumulators辅助类。 对于其他聚合表达式,请使用Document类手动构建表达式。

在以下示例中,聚合管道使用$project阶段仅返回name字段和计算字段firstCategory ,其值是categories数组中的第一个元素。 该示例使用Aggregates.project()和各种Projections类方法构建$project阶段:

collection.aggregate(
Seq(
Aggregates.project(
Projections.fields(
Projections.excludeId(),
Projections.include("name"),
Projections.computed(
"firstCategory",
Document("$arrayElemAt"-> Seq("$categories", 0))
)
)
)
)
).printResults()

$explain聚合管道,请调用AggregatePublisher.explain()方法:

collection.aggregate(
Seq(Aggregates.filter(Filters.eq("categories", "Bakery")),
Aggregates.group("$stars", Accumulators.sum("count", 1)))
).explain().printResults()

后退

批量写入操作