$stdDevSamp(集計)
定義
バージョン 5.0 での変更。
入力値のサンプル標準偏差を計算します。 値が母集団について一般化するデータのサンプルを含む場合は、 を使用します。 $stdDevSamp
は、数値以外の値を無視します。
値がデータの母集団全体を表す場合、またはより大きな人口について一般化したくない場合は、代わりに $stdDevPop
を使用します。
$stdDevSamp
は、次のステージで使用できます。
$setWindowFields
(MongoDB 5.0 以降で使用可能)
構文
$bucket
、 $bucketAuto
、 $group
、 $setWindowFields
ステージで使用する場合、 $stdDevSamp
は次の構文をとります。
{ $stdDevSamp: <expression> }
サポートされている他のステージで使用する場合、 $stdDevSamp
は次の 2 つの構文のいずれかをとります。
$stdDevSamp
にはオペランドとして指定された式が 1 つあります。{ $stdDevSamp: <expression> } $stdDevSamp
にはオペランドとして指定された式のリストがあります。{ $stdDevSamp: [ <expression1>, <expression2> ... ] }
$stdDevSamp
の引数は、配列に解決される限り任意の式にすることができます。
式の詳細については、「式演算子」を参照してください。
動作
Non-numeric Values
$stdDevSamp
は、数値以外の値を無視します。 合計のオペランドがすべて数値以外の場合、 $stdDevSamp
はnull
を返します。
単一の値
サンプルが単一の数値で構成されている場合、 $stdDevSamp
はnull
を返します。
配列オペランド
$group
および$setWindowFields
ステージでは、式が配列に変換される場合、 $stdDevSamp
はオペランドを数値以外の値として扱います。
サポートされている他のステージでは、次のようになります。
単一の式をオペランドとして使用し、その式が配列に変換されると、
$stdDevSamp
は配列内を走査して配列の数値要素に対して操作を実行し、単一の値を返します。式のリストをオペランドとして使用する場合に、式のいずれかが配列に変換されると、 は配列内を 走査せず
$stdDevSamp
、代わりに配列を数値以外の値として扱います。
Window Values
$setWindowFields
ステージウィンドウ内の 値に関する動作
ウィンドウ内の数値以外の値、
null
値、欠落しているフィールドは無視されます。ウィンドウが空の場合、 は
null
を返します。ウィンドウに
NaN
の値が含まれている場合、 はnull
を返します。ウィンドウに
Infinity
の値が含まれている場合、 はnull
を返します。上記の点のいずれにも当てはまらない場合、 は
double
値を返します。
例
$group
ステージで使用
コレクションusers
には次のフィールドを持つドキュメントが含まれています。
{_id: 0, username: "user0", age: 20} {_id: 1, username: "user1", age: 42} {_id: 2, username: "user2", age: 28} ...
ユーザーのサンプルの標準偏差を計算するには、次の集計操作では、まず$sample
パイプラインを使用して100ユーザーをサンプリングし、次に$stdDevSamp
を使用してサンプリングされたユーザーの標準偏差を計算します。
db.users.aggregate( [ { $sample: { size: 100 } }, { $group: { _id: null, ageStdDev: { $stdDevSamp: "$age" } } } ] )
この操作では、次のような結果が返されます。
{ "_id" : null, "ageStdDev" : 7.811258386185771 }
$setWindowFields
ステージで使用
バージョン 5.0 で追加
カリフォルニア州(CA
)とワシントン州(WA
)のケーキ販売を含む cakeSales
コレクションを作成します。
db.cakeSales.insertMany( [ { _id: 0, type: "chocolate", orderDate: new Date("2020-05-18T14:10:30Z"), state: "CA", price: 13, quantity: 120 }, { _id: 1, type: "chocolate", orderDate: new Date("2021-03-20T11:30:05Z"), state: "WA", price: 14, quantity: 140 }, { _id: 2, type: "vanilla", orderDate: new Date("2021-01-11T06:31:15Z"), state: "CA", price: 12, quantity: 145 }, { _id: 3, type: "vanilla", orderDate: new Date("2020-02-08T13:13:23Z"), state: "WA", price: 13, quantity: 104 }, { _id: 4, type: "strawberry", orderDate: new Date("2019-05-18T16:09:01Z"), state: "CA", price: 41, quantity: 162 }, { _id: 5, type: "strawberry", orderDate: new Date("2019-01-08T06:12:03Z"), state: "WA", price: 43, quantity: 134 } ] )
この例では、$stdDevSamp
$setWindowFields
ステージのquantity
を使用して、各 のケーキ販売の 値のサンプル標準偏差を出力します。state
db.cakeSales.aggregate( [ { $setWindowFields: { partitionBy: "$state", sortBy: { orderDate: 1 }, output: { stdDevSampQuantityForState: { $stdDevSamp: "$quantity", window: { documents: [ "unbounded", "current" ] } } } } } ] )
この例では、次のことが行われます。
partitionBy: "$state"
はコレクション内のドキュメントをstate
で分割します。CA
とWA
のパーティションがあります。sortBy: { orderDate: 1 }
は、各パーティション内のドキュメントをorderDate
で昇順(1
)に並べ替えるので、最も古いorderDate
が最初になります。
output
ドキュメント ウィンドウで実行される を使用して、$stdDevSamp
stdDevSampQuantityForState
フィールドを 値のサンプル標準偏差に設定します。quantity
ウィンドウには、
unbounded
下限とcurrent
ドキュメントの間にあるドキュメントが出力されます。 つまり、$stdDevSamp
は、パーティションの先頭から現在のドキュメントまでのドキュメントのquantity
値のサンプル標準偏差を返します。
この出力では、 CA
とWA
のサンプル標準偏差quantity
値がstdDevSampQuantityForState
フィールドに表示されています。
{ "_id" : 4, "type" : "strawberry", "orderDate" : ISODate("2019-05-18T16:09:01Z"), "state" : "CA", "price" : 41, "quantity" : 162, "stdDevSampQuantityForState" : null } { "_id" : 0, "type" : "chocolate", "orderDate" : ISODate("2020-05-18T14:10:30Z"), "state" : "CA", "price" : 13, "quantity" : 120, "stdDevSampQuantityForState" : 29.698484809834994 } { "_id" : 2, "type" : "vanilla", "orderDate" : ISODate("2021-01-11T06:31:15Z"), "state" : "CA", "price" : 12, "quantity" : 145, "stdDevSampQuantityForState" : 21.1266025033211 } { "_id" : 5, "type" : "strawberry", "orderDate" : ISODate("2019-01-08T06:12:03Z"), "state" : "WA", "price" : 43, "quantity" : 134, "stdDevSampQuantityForState" : null } { "_id" : 3, "type" : "vanilla", "orderDate" : ISODate("2020-02-08T13:13:23Z"), "state" : "WA", "price" : 13, "quantity" : 104, "stdDevSampQuantityForState" : 21.213203435596427 } { "_id" : 1, "type" : "chocolate", "orderDate" : ISODate("2021-03-20T11:30:05Z"), "state" : "WA", "price" : 14, "quantity" : 140, "stdDevSampQuantityForState" : 19.28730152198591 }