$topN(集計アキュムレータ)
定義
構文
{ $topN: { n: <expression>, sortBy: { <field1>: <sort order>, <field2>: <sort order> ... }, output: <expression> } }
n
は、グループごとの結果数を制限し、定数であるか、$group
の_id
値に依存する正の整数式である必要があります。sortBy は、
$sort
に似た構文で結果の順序を指定します。output
は、グループ内の各要素の出力を表し、任意の 式 にすることができます。
動作
NULL および欠損値
$topN
は、null 値をフィルタリングで除外しません。$topN
は、出力に保持される欠落値を null に変換します。
db.aggregate( [ { $documents: [ { playerId: "PlayerA", gameId: "G1", score: 1 }, { playerId: "PlayerB", gameId: "G1", score: 2 }, { playerId: "PlayerC", gameId: "G1", score: 3 }, { playerId: "PlayerD", gameId: "G1"}, { playerId: "PlayerE", gameId: "G1", score: null } ] }, { $group: { _id: "$gameId", playerId: { $topN: { output: [ "$playerId", "$score" ], sortBy: { "score": 1 }, n: 3 } } } } ] )
この例では、次のことが行われます。
$documents
は、プレイヤーのスコアを含むリテラル ドキュメントを作成します。$group
はドキュメントをgameId
でグループ化します。 この例ではgameId
、G1
は 1 つのみです。PlayerD
はスコアが欠落しており、PlayerE
には nullscore
があります。 これらの値は両方とも null と見なされます。playerId
フィールドとscore
フィールドはoutput : ["$playerId"," $score"]
として指定され、配列値として返されます。sortBy: { "score" : 1 }
により、null 値は返されたplayerId
配列の前にソートされます。
[ { _id: 'G1', playerId: [ [ 'PlayerD', null ], [ 'PlayerE', null ], [ 'PlayerA', 1 ] ] } ]
BSON データ型ソート順
異なるタイプをソートする場合、順序を決定するためにBSON データ型の順序が使用されます。 例として、値が string と数値で構成されるコレクションを考えてみましょう。
昇順ソートでは、string 値は数値の後にソートされます。
降順ソートでは、string 値が数値の前にソートされます。
db.aggregate( [ { $documents: [ { playerId: "PlayerA", gameId: "G1", score: 1 }, { playerId: "PlayerB", gameId: "G1", score: "2" }, { playerId: "PlayerC", gameId: "G1", score: "" } ] }, { $group: { _id: "$gameId", playerId: { $topN: { output: ["$playerId","$score"], sortBy: {"score": -1}, n: 3 } } } } ] )
この例では、次のことが行われます。
PlayerA
は整数スコアを持ちます。PlayerB
は string"2"
スコアを持ちます。PlayerC
には空のstringスコアがあります。
並べ替えは{ "score" : -1 }
の降順であるため、string リテラル値はPlayerA
の数値スコアより前にソートされます。
[ { _id: "G1", playerId: [ [ "PlayerB", "2" ], [ "PlayerC", "" ], [ "PlayerA", 1 ] ] } ]
制限事項
ウィンドウ関数と集計式のサポート
$topN
集計式としてサポートされていません。
メモリ制限に関する考慮事項
$topN
集計パイプライン内のグループには100 MBのパイプライン制限が適用されます。 個々のグループでこの制限を超えると、集計はエラーで失敗します。
例
以下のドキュメントを持つgamescores
コレクションを考えてみましょう。
db.gamescores.insertMany([ { playerId: "PlayerA", gameId: "G1", score: 31 }, { playerId: "PlayerB", gameId: "G1", score: 33 }, { playerId: "PlayerC", gameId: "G1", score: 99 }, { playerId: "PlayerD", gameId: "G1", score: 1 }, { playerId: "PlayerA", gameId: "G2", score: 10 }, { playerId: "PlayerB", gameId: "G2", score: 14 }, { playerId: "PlayerC", gameId: "G2", score: 66 }, { playerId: "PlayerD", gameId: "G2", score: 80 } ])
最高の 3 を見つける Scores
$topN
アキュムレータを使用すると、単一のゲームで最もスコアの高いプレイヤーを見つけることができます。
db.gamescores.aggregate( [ { $match : { gameId : "G1" } }, { $group: { _id: "$gameId", playerId: { $topN: { output: ["$playerId", "$score"], sortBy: { "score": -1 }, n:3 } } } } ] )
サンプル パイプライン:
$match
を使用して結果を単一のgameId
でフィルタリングします。 この場合は、G1
ます。$group
を使用して結果をgameId
でグループ化します。 この場合は、G1
ます。結果を降順で並べ替えるには、
{ "score": -1 }
による並べ替えを使用します。を使用して
$topN
output : ["$playerId"," $score"]
から出力するフィールドを指定します。$topN
を使用して、n : 3
を持つG1
のゲームでscore
が最も高い上位 3 つのドキュメントを返します。
この操作は次の結果を返します。
[ { _id: 'G1', playerId: [ [ 'PlayerC', 99 ], [ 'PlayerB', 33 ], [ 'PlayerA', 31 ] ] } ]
このクエリに相当する SQL は次のとおりです。
SELECT T3.GAMEID,T3.PLAYERID,T3.SCORE FROM GAMESCORES AS GS JOIN (SELECT TOP 3 GAMEID,PLAYERID,SCORE FROM GAMESCORES WHERE GAMEID = 'G1' ORDER BY SCORE DESC) AS T3 ON GS.GAMEID = T3.GAMEID GROUP BY T3.GAMEID,T3.PLAYERID,T3.SCORE ORDER BY T3.SCORE DESC
複数のゲームにわたる最高スコア ドキュメントの検索
$topN
アキュムレータを使用して、各ゲームで最もスコアの高いプレイヤーを見つけることができます。
db.gamescores.aggregate( [ { $group: { _id: "$gameId", playerId: { $topN: { output: [ "$playerId","$score" ], sortBy: { "score": -1 }, n: 3 } } } } ] )
サンプル パイプライン:
$group
を使用して結果をgameId
でグループ化します。を使用して
$topN
output : ["$playerId", "$score"]
から出力するフィールドを指定します。結果を降順で並べ替えるには、
{ "score": -1 }
による並べ替えを使用します。$topN
を使用して、n: 3
を持つゲームごとに、最も高いscore
を持つ上位 3 つのドキュメントを返します。
この操作は次の結果を返します。
[ { _id: 'G1', playerId: [ [ 'PlayerC', 99 ], [ 'PlayerB', 33 ], [ 'PlayerA', 31 ] ] }, { _id: 'G2', playerId: [ [ 'PlayerD', 80 ], [ 'PlayerC', 66 ], [ 'PlayerB', 14 ] ] } ]
このクエリに相当する SQL は次のとおりです。
SELECT PLAYERID,GAMEID,SCORE FROM( SELECT ROW_NUMBER() OVER (PARTITION BY GAMEID ORDER BY SCORE DESC) AS GAMERANK, GAMEID,PLAYERID,SCORE FROM GAMESCORES ) AS T WHERE GAMERANK <= 3 ORDER BY GAMEID
のグループキーに基づいて を計算n
$group
また、 n
の値を動的に割り当てることもできます。 この例では、 $cond
式はgameId
フィールドで使用されています。
db.gamescores.aggregate([ { $group: { _id: {"gameId": "$gameId"}, gamescores: { $topN: { output: "$score", n: { $cond: { if: {$eq: ["$gameId","G2"] }, then: 1, else: 3 } }, sortBy: { "score": -1 } } } } } ] )
サンプル パイプライン:
$group
を使用して結果をgameId
でグループ化します。を使用して
$topN
output : "$score"
から出力するフィールドを指定します。gameId
がG2
の場合、n
は 1、それ以外の場合、n
は 3 になります。結果を降順で並べ替えるには、
{ "score": -1 }
による並べ替えを使用します。
この操作は次の結果を返します。
[ { _id: { gameId: 'G1' }, gamescores: [ 99, 33, 31 ] }, { _id: { gameId: 'G2' }, gamescores: [ 80 ] } ]