聚合
Aggregates 类提供用于构建聚合管道阶段的静态工厂方法。每个方法都返回一个Bson
类型的实例,而该实例又可以传递给MongoCollection.aggregate()
方法。
您可以静态导入Aggregates
类的方法,如以下代码所示:
import org.mongodb.scala.model.Aggregates._
本指南中的示例假定此静态导入。
匹配
$match
管道阶段将与指定过滤匹配的所有文档传递到下一阶段。 虽然过滤可以是实现Bson
的任何类的实例,但使用筛选器类中的方法会更方便。
以下示例创建了一个管道阶段,用于匹配author
字段值为"Dave"
的所有文档:
`match`(equal("author", "Dave"))
注意
由于match
是Scala中的保留字,必须用反引号转义,因此您可能更愿意使用filter()
别名:
filter(equal("author", "Dave"))
项目
$project
管道阶段将所有文档的投影字段传递到下一阶段。 虽然投影可以是任何实现Bson
的类的实例,但使用Projections类中的方法会更方便。
以下示例创建一个管道阶段,其中不包括 _id
字段,但包括 title
和 author
字段:
project(fields(include("title", "author"), excludeId()))
计算字段
$project
阶段也可以投影计算字段。
以下示例将qty
字段到名为quantity
的新字段。 换句话说,它会重命名该字段:
project(computed("quantity", "$qty"))
抽检 (Sample)
$sample
管道阶段从输入文档中随机选择N
文档。 以下示例使用sample()
方法从集合中随机选择5
文档:
sample(5)
Sort
$sort
管道阶段将所有文档传递到下一阶段,并按指定的排序条件进行排序。 虽然排序条件可以是任何实现Bson
的类的实例,但使用Sorts类中的方法会更方便。
以下示例创建了管道阶段,根据 age
字段的值以降序排序,然后根据 posts
字段的值以升序排序:
sort(orderBy(descending("age"), ascending("posts")))
跳过
$skip
管道阶段会跳过进入该阶段的指定数量的文档,并将剩余文档传递到下一阶段。
以下示例会跳过前5
个文档:
skip(5)
Limit
$limit
管道阶段限制传递到下一阶段的文档数量。
以下示例将文档数量限制为10 :
limit(10)
Lookup
$lookup
管道阶段与另一个集合执行左外连接,以过滤已连接集合中的文档进行处理。
以下示例对fromCollection
集合执行左外连接,将local
字段连接到from
字段,并在joinedOutput
字段中输出:
lookup("fromCollection", "local", "from", "joinedOutput")
GROUP
$group
管道阶段按某些指定的表达式对文档进行分组,并将每个不同分组的文档输出到下一阶段。 一个群组由_id
和零个或多个累加器组成,其中 指定了要群组的表达式,而零个或多个累加器则针对每个分组进行评估。
为了简化累加器的表达式,驱动程序包含一个Accumulators
单例对象,其中包含每个受支持累加器的工厂方法。
以下示例按customerId
字段的值对文档进行分组,并将每个群组的数量字段值的总和和平均值分别累加到totalQuantity
和averageQuantity
字段中:
group("$customerId", sum("totalQuantity", "$quantity"), avg("averageQuantity", "$quantity"))
Unwind
$unwind
管道阶段解构输入文档中的大量字段,为每个元素输出一个文档。
以下示例为每个文档输出sizes
数组中每个元素的文档:
unwind("$sizes")
以下示例还包括sizes
字段缺失值或 null 值,或者sizes
列表为空的任何文档:
unwind("$sizes", UnwindOptions().preserveNullAndEmptyArrays(true))
以下示例展开sizes
数组,并将数组索引输出到position
字段中:
unwind("$sizes", UnwindOptions().includeArrayIndex("$position"))
SetWindowFields
$setWindowFields
管道阶段允许使用窗口操作符。 此阶段对输入文档进行分区,类似于 $group
管道阶段,可以选择对它们进行排序,通过在每个函数指定的Windows上计算窗口函数来计算文档中的字段,然后输出文档。 窗口是分区的子集。
与$group
管道阶段的重要区别在于,属于同一分区或窗口的文档不会折叠为单个文档。
驾驶员包含WindowedComputations
单例对象,其中包含受支持窗口操作符的工厂方法。
以下示例根据rainfall
和temperature
字段中提供的更细粒度的测量值,计算每个地点过去一个月的累计降雨量和平均气温:
val pastMonth: Window = Windows.timeRange(-1, MongoTimeUnit.MONTH, Windows.Bound.CURRENT) setWindowFields(Some("$localityId"), Some(Sorts.ascending("measurementDateTime")), WindowedComputations.sum("monthlyRainfall", "$rainfall", Some(pastMonth)), WindowedComputations.avg("monthlyAvgTemp", "$temperature", Some(pastMonth)))
组装管道
管道操作符通常组合成一个列表并传递给MongoCollection
的aggregate()
方法:
collection.aggregate(List(filter(equal("author", "Dave")), group("$customerId", sum("totalQuantity", "$quantity"), avg("averageQuantity", "$quantity")), out("authors")))