Menu Docs
Página inicial do Docs
/
Manual do MongoDB
/ / /

$topN (acúmulo de agregação)

Nesta página

  • Definição
  • Sintaxe
  • Comportamento
  • Restrições
  • Exemplos
$topN

Novidades na versão 5.2.

Retorna uma aggregation dos principais n elementos dentro de um grupo, de acordo com a ordem de classificação especificada. Se o grupo tiver menos de n elementos, $topN retornará todos os elementos no grupo.

{
$topN:
{
n: <expression>,
sortBy: { <field1>: <sort order>, <field2>: <sort order> ... },
output: <expression>
}
}
  • n limita o número de resultados por grupo e deve ser uma expressão integral positiva que seja constante ou dependa do valor _id para $group.

  • sortBy especifica a ordem dos resultados, com sintaxe semelhante a $sort .

  • output Representa a saída de cada elemento no grupo e pode ser qualquer expressão.

  • $topN não filtra valores nulos.

  • $topN converte valores ausentes em nulo que são preservados na saída.

db.aggregate( [
{
$documents: [
{ playerId: "PlayerA", gameId: "G1", score: 1 },
{ playerId: "PlayerB", gameId: "G1", score: 2 },
{ playerId: "PlayerC", gameId: "G1", score: 3 },
{ playerId: "PlayerD", gameId: "G1"},
{ playerId: "PlayerE", gameId: "G1", score: null }
]
},
{
$group:
{
_id: "$gameId",
playerId:
{
$topN:
{
output: [ "$playerId", "$score" ],
sortBy: { "score": 1 },
n: 3
}
}
}
}
] )

Neste exemplo:

  • $documents cria os documentos literais que contêm as pontuações dos jogadores.

  • $group agrupa os documentos por gameId. Este exemplo tem apenas um gameId, G1.

  • PlayerD tem uma pontuação ausente e PlayerE tem um nulo score. Esses valores são considerados nulos.

  • Os campos playerId e score são especificados como output : ["$playerId"," $score"] e retornados como valores de array.

  • Devido a sortBy: { "score" : 1 }, os valores nulos são ordenados para a frente do array playerId retornado.

[
{
_id: 'G1',
playerId: [ [ 'PlayerD', null ], [ 'PlayerE', null ], [ 'PlayerA', 1 ] ]
}
]

Ao classificar diferentes tipos, a ordem dos tipos de dados BSON é usada para determinar a ordem. Como exemplo, considere uma collection cujos valores consistem em strings e números.

  • Em uma classificação crescente, os valores de string são classificados após valores numéricos.

  • Em uma classificação decrescente, os valores de string são classificados antes dos valores numéricos.

db.aggregate( [
{
$documents: [
{ playerId: "PlayerA", gameId: "G1", score: 1 },
{ playerId: "PlayerB", gameId: "G1", score: "2" },
{ playerId: "PlayerC", gameId: "G1", score: "" }
]
},
{
$group:
{
_id: "$gameId",
playerId: {
$topN:
{
output: ["$playerId","$score"],
sortBy: {"score": -1},
n: 3
}
}
}
}
] )

Neste exemplo:

  • PlayerA tem uma pontuação inteira.

  • PlayerB tem uma pontuação de string "2" .

  • PlayerC tem uma pontuação de string vazia.

Como a classificação está em { "score" : -1 } decrescente, os valores literais da string são classificados antes da pontuação numérica PlayerA:

[
{
_id: "G1",
playerId: [ [ "PlayerB", "2" ], [ "PlayerC", "" ], [ "PlayerA", 1 ] ]
}
]

$topN não é suportado como uma expressão de agregação.

$topN é suportado como um window operator.

Os grupos do aggregation pipeline $topN estão sujeitos ao limite de 100 MB do pipeline. Se esse limite for excedido para um grupo individual, a agregação falhará com um erro.

Considere uma collection gamescores com os seguintes documentos:

db.gamescores.insertMany([
{ playerId: "PlayerA", gameId: "G1", score: 31 },
{ playerId: "PlayerB", gameId: "G1", score: 33 },
{ playerId: "PlayerC", gameId: "G1", score: 99 },
{ playerId: "PlayerD", gameId: "G1", score: 1 },
{ playerId: "PlayerA", gameId: "G2", score: 10 },
{ playerId: "PlayerB", gameId: "G2", score: 14 },
{ playerId: "PlayerC", gameId: "G2", score: 66 },
{ playerId: "PlayerD", gameId: "G2", score: 80 }
])

Você pode usar o acumulador $topN para encontrar os jogadores com maior pontuação em um único jogo.

db.gamescores.aggregate( [
{
$match : { gameId : "G1" }
},
{
$group:
{
_id: "$gameId",
playerId:
{
$topN:
{
output: ["$playerId", "$score"],
sortBy: { "score": -1 },
n:3
}
}
}
}
] )

O exemplo de pipeline:

  • Utiliza $match para filtrar os resultados em um único gameId. Neste caso, G1.

  • Utiliza $group para agrupar os resultados por gameId. Neste caso, G1.

  • Utiliza a classificação por { "score": -1 } para classificar os resultados em ordem decrescente.

  • Especifica os campos que são saídas do $topN com output : ["$playerId"," $score"] .

  • Usa $topN para retornar os três principais documentos com a maior score para o jogo G1 com n : 3.

A operação retorna os seguintes resultados:

[
{
_id: 'G1',
playerId: [ [ 'PlayerC', 99 ], [ 'PlayerB', 33 ], [ 'PlayerA', 31 ] ]
}
]

O equivalente SQL a esta query é:

SELECT T3.GAMEID,T3.PLAYERID,T3.SCORE
FROM GAMESCORES AS GS
JOIN (SELECT TOP 3
GAMEID,PLAYERID,SCORE
FROM GAMESCORES
WHERE GAMEID = 'G1'
ORDER BY SCORE DESC) AS T3
ON GS.GAMEID = T3.GAMEID
GROUP BY T3.GAMEID,T3.PLAYERID,T3.SCORE
ORDER BY T3.SCORE DESC

Você pode usar o acumulador $topN para encontrar os jogadores com maior pontuação em cada jogo.

db.gamescores.aggregate( [
{
$group:
{ _id: "$gameId", playerId:
{
$topN:
{
output: [ "$playerId","$score" ],
sortBy: { "score": -1 },
n: 3
}
}
}
}
] )

O exemplo de pipeline:

  • Utiliza $group para agrupar os resultados por gameId.

  • Especifica os campos que são saídas do $topN com output : ["$playerId", "$score"] .

  • Utiliza a classificação por { "score": -1 } para classificar os resultados em ordem decrescente.

  • Usa $topN para retornar os três principais documentos com a maior score para cada jogo com n: 3.

A operação retorna os seguintes resultados:

[
{
_id: 'G1',
playerId: [ [ 'PlayerC', 99 ], [ 'PlayerB', 33 ], [ 'PlayerA', 31 ] ]
},
{
_id: 'G2',
playerId: [ [ 'PlayerD', 80 ], [ 'PlayerC', 66 ], [ 'PlayerB', 14 ] ]
}
]

O equivalente SQL a esta query é:

SELECT PLAYERID,GAMEID,SCORE
FROM(
SELECT ROW_NUMBER() OVER (PARTITION BY GAMEID ORDER BY SCORE DESC) AS GAMERANK,
GAMEID,PLAYERID,SCORE
FROM GAMESCORES
) AS T
WHERE GAMERANK <= 3
ORDER BY GAMEID

Você também pode atribuir o valor de n dinamicamente. Neste exemplo, a expressão $cond é utilizada no campo gameId .

db.gamescores.aggregate([
{
$group:
{
_id: {"gameId": "$gameId"},
gamescores:
{
$topN:
{
output: "$score",
n: { $cond: { if: {$eq: ["$gameId","G2"] }, then: 1, else: 3 } },
sortBy: { "score": -1 }
}
}
}
}
] )

O exemplo de pipeline:

  • Utiliza $group para agrupar os resultados por gameId.

  • Especifica os campos que são saídas do $topN com output : "$score" .

  • Se gameId for G2 então n é 1, caso contrário n é 3.

  • Utiliza a classificação por { "score": -1 } para classificar os resultados em ordem decrescente.

A operação retorna os seguintes resultados:

[
{ _id: { gameId: 'G1' }, gamescores: [ 99, 33, 31 ] },
{ _id: { gameId: 'G2' }, gamescores: [ 80 ] }
]

Voltar

$top