$locf(聚合)
定义
$locf
5.2 版本中的新增功能。
最后一次观察结果被延续了下来。 将窗口中
null
和缺失字段的值设置为该字段的最后一个非空值。$locf
只能在$setWindowFields
阶段使用。
语法
$locf
表达式的语法如下:
{ $locf: <expression> }
有关表达式的更多信息,请参阅表达式运算符。
行为
如果填充的字段同时包含null
和非空值,则$locf
会根据$setWindowFields
中指定的排序顺序将null
和缺失值设置为字段的最后一个已知非空值。
null
而排序顺序中出现在非空值之前的缺失字段值仍为 null
。
如果填充的字段仅包含null
或分区中的缺失值,则$locf
会将该分区的字段值设置为null
。
和$fill
$locf
的比较
要根据序列中的最后一个观察值填充缺失的字段值,可以使用:
具有
{ method: "locf" }
的$fill
阶段。使用
$fill
阶段时,您在输出中指定的字段与源数据使用的字段相同。 请参阅根据上次观察到的值填充缺失字段值。$locf
$setWindowFields
阶段内的 操作符。使用
$locf
操作符时,您可以为与用作源数据的字段不同的字段设置值。 请参阅在单个阶段中使用多种填充方法。
示例
本页上的示例使用stock
集合,其中包含每小时跟踪单个公司的股票价格:
db.stock.insertMany( [ { time: ISODate("2021-03-08T09:00:00.000Z"), price: 500 }, { time: ISODate("2021-03-08T10:00:00.000Z"), }, { time: ISODate("2021-03-08T11:00:00.000Z"), price: 515 }, { time: ISODate("2021-03-08T12:00:00.000Z") }, { time: ISODate("2021-03-08T13:00:00.000Z") }, { time: ISODate("2021-03-08T14:00:00.000Z"), price: 485 } ] )
集合中的某些文档缺少 price
字段。
用最后观察到的值填充缺失值
以下示例使用$locf
操作符将缺失字段设置为上次观察到的非null
值中的值:
db.stock.aggregate( [ { $setWindowFields: { sortBy: { time: 1 }, output: { price: { $locf: "$price" } } } } ] )
在示例中:
sortBy: { time: 1 }
按time
以升序 (1
) 对每个分区中的文档进行排序,因此最早的time
位于最前面。对于缺少
price
字段的文档,$locf
操作符会将price
设置为序列中最后观察到的值。
示例输出:
[ { _id: ObjectId("62169b65394d47411658b5f5"), time: ISODate("2021-03-08T09:00:00.000Z"), price: 500 }, { _id: ObjectId("62169b65394d47411658b5f6"), time: ISODate("2021-03-08T10:00:00.000Z"), price: 500 }, { _id: ObjectId("62169b65394d47411658b5f7"), time: ISODate("2021-03-08T11:00:00.000Z"), price: 515 }, { _id: ObjectId("62169b65394d47411658b5f8"), time: ISODate("2021-03-08T12:00:00.000Z"), price: 515 }, { _id: ObjectId("62169b65394d47411658b5f9"), time: ISODate("2021-03-08T13:00:00.000Z"), price: 515 }, { _id: ObjectId("62169b65394d47411658b5fa"), time: ISODate("2021-03-08T14:00:00.000Z"), price: 485 } ]
在单个阶段使用多种填充方法
当您使用$setWindowFields
阶段填充缺失值时,您可以为与填充字段不同的字段设置值。 因此,您可以在单个$setWindowFields
阶段使用多种填充方法,并在不同字段中输出结果。
以下管道使用price
线性插值 填充缺失的 字段 以及最后观察结转方法:
db.stock.aggregate( [ { $setWindowFields: { sortBy: { time: 1 }, output: { linearFillPrice: { $linearFill: "$price" }, locfPrice: { $locf: "$price" } } } } ] )
在示例中:
sortBy: { time: 1 }
按time
字段以升序排列文档,从最早到最晚。输出指定:
linearFillPrice
作为要填充的目标字段。{ $linearFill: "$price" }
是linearFillPrice
字段的值。 使用 线性插值$linearFill
填充缺失的price
值price
基于序列中周围的 值。
locfPrice
作为要填充的目标字段。{ $locf: "$price" }
是locfPrice
字段的值。locf
代表最后的观察结果。$locf
使用序列中上一个文档中的值填充缺失的price
值。
示例输出:
[ { _id: ObjectId("620ad555394d47411658b5ef"), time: ISODate("2021-03-08T09:00:00.000Z"), price: 500, linearFillPrice: 500, locfPrice: 500 }, { _id: ObjectId("620ad555394d47411658b5f0"), time: ISODate("2021-03-08T10:00:00.000Z"), linearFillPrice: 507.5, locfPrice: 500 }, { _id: ObjectId("620ad555394d47411658b5f1"), time: ISODate("2021-03-08T11:00:00.000Z"), price: 515, linearFillPrice: 515, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f2"), time: ISODate("2021-03-08T12:00:00.000Z"), linearFillPrice: 505, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f3"), time: ISODate("2021-03-08T13:00:00.000Z"), linearFillPrice: 495, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f4"), time: ISODate("2021-03-08T14:00:00.000Z"), price: 485, linearFillPrice: 485, locfPrice: 485 } ]