$topN (acúmulo de agregação)
Nesta página
Definição
Sintaxe
{ $topN: { n: <expression>, sortBy: { <field1>: <sort order>, <field2>: <sort order> ... }, output: <expression> } }
Comportamento
Valores nulos e ausentes
$topN
não filtra valores nulos.$topN
converte valores ausentes em nulo que são preservados na saída.
db.aggregate( [ { $documents: [ { playerId: "PlayerA", gameId: "G1", score: 1 }, { playerId: "PlayerB", gameId: "G1", score: 2 }, { playerId: "PlayerC", gameId: "G1", score: 3 }, { playerId: "PlayerD", gameId: "G1"}, { playerId: "PlayerE", gameId: "G1", score: null } ] }, { $group: { _id: "$gameId", playerId: { $topN: { output: [ "$playerId", "$score" ], sortBy: { "score": 1 }, n: 3 } } } } ] )
Neste exemplo:
$documents
cria os documentos literais que contêm as pontuações dos jogadores.$group
agrupa os documentos porgameId
. Este exemplo tem apenas umgameId
,G1
.PlayerD
tem uma pontuação ausente ePlayerE
tem um nuloscore
. Esses valores são considerados nulos.Os campos
playerId
escore
são especificados comooutput : ["$playerId"," $score"]
e retornados como valores de array.Devido a
sortBy: { "score" : 1 }
, os valores nulos são ordenados para a frente do arrayplayerId
retornado.
[ { _id: 'G1', playerId: [ [ 'PlayerD', null ], [ 'PlayerE', null ], [ 'PlayerA', 1 ] ] } ]
Ordenação de classificação do tipo de dados BSON
Ao classificar diferentes tipos, a ordem dos tipos de dados BSON é usada para determinar a ordem. Como exemplo, considere uma collection cujos valores consistem em strings e números.
Em uma classificação crescente, os valores de string são classificados após valores numéricos.
Em uma classificação decrescente, os valores de string são classificados antes dos valores numéricos.
db.aggregate( [ { $documents: [ { playerId: "PlayerA", gameId: "G1", score: 1 }, { playerId: "PlayerB", gameId: "G1", score: "2" }, { playerId: "PlayerC", gameId: "G1", score: "" } ] }, { $group: { _id: "$gameId", playerId: { $topN: { output: ["$playerId","$score"], sortBy: {"score": -1}, n: 3 } } } } ] )
Neste exemplo:
PlayerA
tem uma pontuação inteira.PlayerB
tem uma pontuação de string"2"
.PlayerC
tem uma pontuação de string vazia.
Como a classificação está em { "score" : -1 }
decrescente, os valores literais da string são classificados antes da pontuação numérica PlayerA
:
[ { _id: "G1", playerId: [ [ "PlayerB", "2" ], [ "PlayerC", "" ], [ "PlayerA", 1 ] ] } ]
Restrições
Suporte para função de janela e expressão de agregação
$topN
não é suportado como uma expressão de agregação.
$topN
é suportado como um window operator
.
Considerações sobre o limite de memória
Os grupos do aggregation pipeline $topN
estão sujeitos ao limite de 100 MB do pipeline. Se esse limite for excedido para um grupo individual, a agregação falhará com um erro.
Exemplos
Considere uma collection gamescores
com os seguintes documentos:
db.gamescores.insertMany([ { playerId: "PlayerA", gameId: "G1", score: 31 }, { playerId: "PlayerB", gameId: "G1", score: 33 }, { playerId: "PlayerC", gameId: "G1", score: 99 }, { playerId: "PlayerD", gameId: "G1", score: 1 }, { playerId: "PlayerA", gameId: "G2", score: 10 }, { playerId: "PlayerB", gameId: "G2", score: 14 }, { playerId: "PlayerC", gameId: "G2", score: 66 }, { playerId: "PlayerD", gameId: "G2", score: 80 } ])
Encontre os três mais altos Scores
Você pode usar o acumulador $topN
para encontrar os jogadores com maior pontuação em um único jogo.
db.gamescores.aggregate( [ { $match : { gameId : "G1" } }, { $group: { _id: "$gameId", playerId: { $topN: { output: ["$playerId", "$score"], sortBy: { "score": -1 }, n:3 } } } } ] )
O exemplo de pipeline:
Utiliza
$match
para filtrar os resultados em um únicogameId
. Neste caso,G1
.Utiliza
$group
para agrupar os resultados porgameId
. Neste caso,G1
.Utiliza a classificação por
{ "score": -1 }
para classificar os resultados em ordem decrescente.Especifica os campos que são saídas do
$topN
comoutput : ["$playerId"," $score"]
.Usa
$topN
para retornar os três principais documentos com a maiorscore
para o jogoG1
comn : 3
.
A operação retorna os seguintes resultados:
[ { _id: 'G1', playerId: [ [ 'PlayerC', 99 ], [ 'PlayerB', 33 ], [ 'PlayerA', 31 ] ] } ]
O equivalente SQL a esta query é:
SELECT T3.GAMEID,T3.PLAYERID,T3.SCORE FROM GAMESCORES AS GS JOIN (SELECT TOP 3 GAMEID,PLAYERID,SCORE FROM GAMESCORES WHERE GAMEID = 'G1' ORDER BY SCORE DESC) AS T3 ON GS.GAMEID = T3.GAMEID GROUP BY T3.GAMEID,T3.PLAYERID,T3.SCORE ORDER BY T3.SCORE DESC
Encontrar os três documentos de pontuação mais alta em vários jogos
Você pode usar o acumulador $topN
para encontrar os jogadores com maior pontuação em cada jogo.
db.gamescores.aggregate( [ { $group: { _id: "$gameId", playerId: { $topN: { output: [ "$playerId","$score" ], sortBy: { "score": -1 }, n: 3 } } } } ] )
O exemplo de pipeline:
Utiliza
$group
para agrupar os resultados porgameId
.Especifica os campos que são saídas do
$topN
comoutput : ["$playerId", "$score"]
.Utiliza a classificação por
{ "score": -1 }
para classificar os resultados em ordem decrescente.Usa
$topN
para retornar os três principais documentos com a maiorscore
para cada jogo comn: 3
.
A operação retorna os seguintes resultados:
[ { _id: 'G1', playerId: [ [ 'PlayerC', 99 ], [ 'PlayerB', 33 ], [ 'PlayerA', 31 ] ] }, { _id: 'G2', playerId: [ [ 'PlayerD', 80 ], [ 'PlayerC', 66 ], [ 'PlayerB', 14 ] ] } ]
O equivalente SQL a esta query é:
SELECT PLAYERID,GAMEID,SCORE FROM( SELECT ROW_NUMBER() OVER (PARTITION BY GAMEID ORDER BY SCORE DESC) AS GAMERANK, GAMEID,PLAYERID,SCORE FROM GAMESCORES ) AS T WHERE GAMERANK <= 3 ORDER BY GAMEID
Cálculo n
de com base na chave de grupo para $group
Você também pode atribuir o valor de n
dinamicamente. Neste exemplo, a expressão $cond
é utilizada no campo gameId
.
db.gamescores.aggregate([ { $group: { _id: {"gameId": "$gameId"}, gamescores: { $topN: { output: "$score", n: { $cond: { if: {$eq: ["$gameId","G2"] }, then: 1, else: 3 } }, sortBy: { "score": -1 } } } } } ] )
O exemplo de pipeline:
Utiliza
$group
para agrupar os resultados porgameId
.Especifica os campos que são saídas do
$topN
comoutput : "$score"
.Se
gameId
forG2
entãon
é 1, caso contrárion
é 3.Utiliza a classificação por
{ "score": -1 }
para classificar os resultados em ordem decrescente.
A operação retorna os seguintes resultados:
[ { _id: { gameId: 'G1' }, gamescores: [ 99, 33, 31 ] }, { _id: { gameId: 'G2' }, gamescores: [ 80 ] } ]