$locf(集計)
定義
$locf
バージョン 5.2 で追加。
Last observation carried forward(LOCF)法。 ウィンドウ内の
null
と欠落フィールドの値として、フィールドの最後の null 以外の値を設定します。$locf
は$setWindowFields
ステージでのみ使用可能です。
構文
$locf
式は次の構文をとります。
{ $locf: <expression> }
式の詳細については、「式演算子」を参照してください。
動作
入力されているフィールドにnull
と null 以外の値の両方が含まれている場合、 $locf
は、$setWindowFields
で指定された並べ替え順序に従って、 null
と欠損値をフィールドの最後の既知の null 以外の値に設定し 。
null
並べ替え順序 で null 以外の値の前に表示される欠落しているフィールド値はnull
のままです。
入力されているフィールドにパーティション内でnull
または欠落値のみが含まれている場合、 $locf
はそのパーティションのフィールド値をnull
に設定します。
と$fill
$locf
の比較
シーケンス内の最後の観察値に基づいて欠落しているフィールド値を入力するには、次を使用します。
{ method: "locf" }
を持つ$fill
ステージ。$fill
ステージを使用する場合、出力で指定するフィールドはソースデータと同じフィールドになります。 「最後に確認された値に基づいて、欠落しているフィールド値を入力する 」を参照してください。$locf
$setWindowFields
ステージ内の 演算子。$locf
演算子を使用すると、ソースデータとして使用されるフィールドとは異なるフィールドに値を設定できます。 「 1 つのステージで複数の入力メソッドを使用する 」を参照してください。
例
このページの例では、1 つの会社の株価を時間単位で追跡するstock
コレクションを使用します。
db.stock.insertMany( [ { time: ISODate("2021-03-08T09:00:00.000Z"), price: 500 }, { time: ISODate("2021-03-08T10:00:00.000Z"), }, { time: ISODate("2021-03-08T11:00:00.000Z"), price: 515 }, { time: ISODate("2021-03-08T12:00:00.000Z") }, { time: ISODate("2021-03-08T13:00:00.000Z") }, { time: ISODate("2021-03-08T14:00:00.000Z"), price: 485 } ] )
コレクション内の一部のドキュメントでprice
フィールドが欠落しています。
欠落値を最後に確認された値で入力
次の例では、 $locf
演算子を使用して、欠落しているフィールドに最後に確認された以外のnull
値の値を設定します。
db.stock.aggregate( [ { $setWindowFields: { sortBy: { time: 1 }, output: { price: { $locf: "$price" } } } } ] )
この例では、次のことが行われます。
sortBy: { time: 1 }
は、各パーティション内のドキュメントをtime
で昇順(1
)に並べ替えるので、最も古いtime
が最初になります。price
フィールドが欠落しているドキュメントの場合、$locf
演算子はprice
をシーケンス内で最後に確認された値に設定します。
出力例:
[ { _id: ObjectId("62169b65394d47411658b5f5"), time: ISODate("2021-03-08T09:00:00.000Z"), price: 500 }, { _id: ObjectId("62169b65394d47411658b5f6"), time: ISODate("2021-03-08T10:00:00.000Z"), price: 500 }, { _id: ObjectId("62169b65394d47411658b5f7"), time: ISODate("2021-03-08T11:00:00.000Z"), price: 515 }, { _id: ObjectId("62169b65394d47411658b5f8"), time: ISODate("2021-03-08T12:00:00.000Z"), price: 515 }, { _id: ObjectId("62169b65394d47411658b5f9"), time: ISODate("2021-03-08T13:00:00.000Z"), price: 515 }, { _id: ObjectId("62169b65394d47411658b5fa"), time: ISODate("2021-03-08T14:00:00.000Z"), price: 485 } ]
1 つのステージで複数の入力メソッドを使用する
$setWindowFields
ステージを使用して欠落値を入力する場合、入力フィールドとは異なるフィールドに値を設定できます。 その結果、単一の$setWindowFields
ステージで複数の入力メソッドを使用して、結果を個別のフィールドに出力できます。
次のパイプラインは、price
線形補間 を使用して欠落している フィールドを入力します および last-observation-caled-forward メソッド。
db.stock.aggregate( [ { $setWindowFields: { sortBy: { time: 1 }, output: { linearFillPrice: { $linearFill: "$price" }, locfPrice: { $locf: "$price" } } } } ] )
この例では、次のことが行われます。
sortBy: { time: 1 }
は、ドキュメントをtime
フィールドで最初から最新の順に昇順でソートします。出力は以下を指定します。
linearFillPrice
入力するターゲット フィールドとして を使用します。{ $linearFill: "$price" }
は、linearFillPrice
フィールドの値です。$linearFill
はprice
線形補間 を使用して欠落している 値を埋めます シーケンス内の周囲のprice
値に基づきます。
locfPrice
入力するターゲット フィールドとして を使用します。{ $locf: "$price" }
は、locfPrice
フィールドの値です。locf
は、転送された最後の観察を示します。$locf
は、欠落しているprice
値をシーケンス内の前のドキュメントの値で埋めます。
出力例:
[ { _id: ObjectId("620ad555394d47411658b5ef"), time: ISODate("2021-03-08T09:00:00.000Z"), price: 500, linearFillPrice: 500, locfPrice: 500 }, { _id: ObjectId("620ad555394d47411658b5f0"), time: ISODate("2021-03-08T10:00:00.000Z"), linearFillPrice: 507.5, locfPrice: 500 }, { _id: ObjectId("620ad555394d47411658b5f1"), time: ISODate("2021-03-08T11:00:00.000Z"), price: 515, linearFillPrice: 515, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f2"), time: ISODate("2021-03-08T12:00:00.000Z"), linearFillPrice: 505, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f3"), time: ISODate("2021-03-08T13:00:00.000Z"), linearFillPrice: 495, locfPrice: 515 }, { _id: ObjectId("620ad555394d47411658b5f4"), time: ISODate("2021-03-08T14:00:00.000Z"), price: 485, linearFillPrice: 485, locfPrice: 485 } ]