$densify (agregação)

Nesta página

Definição
Sintaxe
Comportamento e restrições
Exemplos

Definição

$densify

Novidades na versão 5.1.

Cria novos documentos em uma sequência de documentos onde determinados valores em um campo estão faltando.

Você pode usar $densify para:

Preencha lacunas nos dados de séries temporais.
Adicione valores ausentes entre grupos de dados.
Preencha seus dados com um intervalo de valores especificado.

Sintaxe

O estágio $densify tem esta sintaxe:

{
   $densify: {
      field: <fieldName>,
      partitionByFields: [ <field 1>, <field 2> ... <field n> ],
      range: {
         step: <number>,
         unit: <time unit>,
         bounds: < "full" || "partition" > || [ < lower bound >, < upper bound > ]
      }
   }
}

O estágio $densify toma um documento com estes campos:

Campo	necessidade	Descrição
Campo	Obrigatório	O campo para densificar. Os valores do `field` especificado devem ser todos os valores numéricos ou todas as datas. Os documentos que não contêm o `field` especificado continuam pelo pipeline não modificado. Para especificar um `<field>` em um documento incorporado ou em uma array, use a notação de ponto. Para restrições, consulte `field` Restrições do.
Partição por campos	Opcional	O conjunto de campos para agir como a chave composta para agrupar os documentos. No estágio, cada grupo de `$densify` documentos é conhecido como uma partição. Se você omitir este campo, o utilizará uma partição para toda a`$densify` coleção. Para obter um exemplo, consulte Densificação com partições. Para restrições, consulte `partitionByFields` Restrições do.
faixa	Obrigatório	Um objeto que especifica como os dados são densificados.
range.bounds	Obrigatório	Você pode especificar `range.bounds` como: An array: `[ < lower bound >, < upper bound > ]`, Uma string: `"full"` ou `"partition"`. Se `bounds` for uma array: `$densify` adiciona documentos abrangendo o intervalo de valores dentro dos limites especificados. O tipo de dados para os limites deve corresponder ao tipo de dados no campo sendo densificado. Para obter detalhes sobre o `range.bounds` comportamento, consulte Comportamento. Se `bounds` for `"full"`: `$densify` adiciona documentos que abrangem toda a gama de valores do que `field` está sendo densificado. Se `bounds` for `"partition"`: `$densify` adiciona documentos a cada partição, semelhante a se você tivesse executado uma `full` densificação de intervalo de em cada partição individualmente.
range.step	Obrigatório	O valor para incrementar o valor do campo em cada documento. `$densify` cria um novo documento para cada `step` entre os documentos existentes. Se range.unit for especificado, o`step` deverá ser um número inteiro. Caso contrário, `step` pode ser qualquer valor numérico.
range.unit	Necessário se o campo for uma data.	A unidade a aplicar ao campo etapa ao incrementar valores de data no campo. Você pode especificar um dos seguintes valores para `unit` como uma string: `millisecond` `second` `minute` `hour` `day` `week` `month` `quarter` `year` Para ver um exemplo, consulte Densificar dados de séries temporais.

Comportamento e restrições

`field` Restrições

Para documentos que contêm o campo especificado, $densify retornará um erro se:

Qualquer documento na coleção tem um valor de field da data do tipo e o campo unidade não é especificado.
Qualquer documento na coleção tem um valor de field do tipo numérico e o campo unidade é especificado.
O nome field começa com $. Você deve renomear o campo se quiser densificá-lo. Para renomear campos, use $project.

`partitionByFields` Restrições

$densify retornará um erro se algum nome de campo na array partitionByFields:

Avalia para um valor não string.
Começa com $.

`range.bounds` Comportamento

Se range.bounds for uma array:

O limite inferior indica o valor inicial para os documentos adicionados, independentemente dos documentos que já estão na coleção.
O limite inferior é inclusivo.
O limite superior é exclusivo.
$densify não filtra documentos com valores de campo fora dos limites especificados.

Observação

A partir do MongoDB,8.0 $densify trata os limites com um limite inferior e superior iguais como um conjunto vazio e não gera um documento com o limite como o valor do campo .

Em versões anteriores, trata os limites com um limite inferior e superior iguais como um intervalo fechado e gera um documento com o valor do limite como um valor de campo se a collection ainda não contiver um documento com o valor do$densify limite.

Por exemplo, um range.bounds de [10, 10] gera um documento extra com valor de campo 10 nas versões anteriores 8.0 a, mas não gera esse documento em 8.0 e posterior.

Ordem de saída

$densify não garante a ordem de classificação dos documentos gerados.

Para garantir a ordem de classificação, utilize $sort no campo pelo qual você deseja classificar.

Exemplos

Densificar dados de série temporal

Crie uma coleção weather que contenha leituras de temperatura em intervalos de quatro horas.

db.weather.insertMany( [
   {
       "metadata": { "sensorId": 5578, "type": "temperature" },
       "timestamp": ISODate("2021-05-18T00:00:00.000Z"),
       "temp": 12
   },
   {
       "metadata": { "sensorId": 5578, "type": "temperature" },
       "timestamp": ISODate("2021-05-18T04:00:00.000Z"),
       "temp": 11
   },
   {
       "metadata": { "sensorId": 5578, "type": "temperature" },
       "timestamp": ISODate("2021-05-18T08:00:00.000Z"),
       "temp": 11
   },
   {
       "metadata": { "sensorId": 5578, "type": "temperature" },
       "timestamp": ISODate("2021-05-18T12:00:00.000Z"),
       "temp": 12
   }
] )

Este exemplo utiliza o estágio $densify para preencher as lacunas entre os intervalos de quatro horas para obter a granularidade por hora para os pontos de dados:

db.weather.aggregate( [
   {
      $densify: {
         field: "timestamp",
         range: {
            step: 1,
            unit: "hour",
            bounds:[ ISODate("2021-05-18T00:00:00.000Z"), ISODate("2021-05-18T08:00:00.000Z") ]
         }
      }
   }
] )

No exemplo:

O estágio $densify preenche as lacunas de tempo entre as temperaturas registradas.
- field: "timestamp" densifica o campo timestamp.
- range:
  - step: 1 incrementa o campo timestamp por unidade 1.
  - unit: hour densifica o campo timestamp por hora.
  - bounds: [ ISODate("2021-05-18T00:00:00.000Z"), ISODate("2021-05-18T08:00:00.000Z") ] define o intervalo de tempo que é densificado.

Na saída seguinte, o estágio $densify preenche as lacunas de tempo entre as horas de 00:00:00 e 08:00:00.

[
  {
    _id: ObjectId("618c207c63056cfad0ca4309"),
    metadata: { sensorId: 5578, type: 'temperature' },
    timestamp: ISODate("2021-05-18T00:00:00.000Z"),
    temp: 12
  },
  { timestamp: ISODate("2021-05-18T01:00:00.000Z") },
  { timestamp: ISODate("2021-05-18T02:00:00.000Z") },
  { timestamp: ISODate("2021-05-18T03:00:00.000Z") },
  {
    _id: ObjectId("618c207c63056cfad0ca430a"),
    metadata: { sensorId: 5578, type: 'temperature' },
    timestamp: ISODate("2021-05-18T04:00:00.000Z"),
    temp: 11
  },
  { timestamp: ISODate("2021-05-18T05:00:00.000Z") },
  { timestamp: ISODate("2021-05-18T06:00:00.000Z") },
  { timestamp: ISODate("2021-05-18T07:00:00.000Z") },
  {
    _id: ObjectId("618c207c63056cfad0ca430b"),
    metadata: { sensorId: 5578, type: 'temperature' },
    timestamp: ISODate("2021-05-18T08:00:00.000Z"),
    temp: 11
  }
  {
    _id: ObjectId("618c207c63056cfad0ca430c"),
    metadata: { sensorId: 5578, type: 'temperature' },
    timestamp: ISODate("2021-05-18T12:00:00.000Z"),
    temp: 12
  }
]

Densificação com divisórias

Crie uma coleção do coffee que contenha dados para duas variedades de grãos de café:

db.coffee.insertMany( [
   {
      "altitude": 600,
      "variety": "Arabica Typica",
      "score": 68.3
   },
   {
      "altitude": 750,
      "variety": "Arabica Typica",
      "score": 69.5
   },
   {
      "altitude": 950,
      "variety": "Arabica Typica",
      "score": 70.5
   },
   {
      "altitude": 1250,
      "variety": "Gesha",
      "score": 88.15
   },
   {
     "altitude": 1700,
     "variety": "Gesha",
     "score": 95.5,
     "price": 1029
   }
] )

Densifique toda a gama de valores

Este exemplo utiliza $densify para densificar o campo altitude para cada café variety:

db.coffee.aggregate( [
   {
      $densify: {
         field: "altitude",
         partitionByFields: [ "variety" ],
         range: {
            bounds: "full",
            step: 200
         }
      }
   }
] )

A agregação de exemplo:

Partições dos documentos por variety para criar um cluster para Arabica Typica e um para Gesha café.
Especifica um intervalo do full, significando que os dados são densificados ao longo do intervalo completo de documentos existentes para cada partição.
Especifica um step de 200, o que significa que novos documentos são criados em intervalos de altitude de 200.

A aggregation produz os seguintes documentos:

[
   {
     _id: ObjectId("618c031814fbe03334480475"),
     altitude: 600,
     variety: 'Arabica Typica',
     score: 68.3
   },
   {
     _id: ObjectId("618c031814fbe03334480476"),
     altitude: 750,
     variety: 'Arabica Typica',
     score: 69.5
   },
   { variety: 'Arabica Typica', altitude: 800 },
   {
     _id: ObjectId("618c031814fbe03334480477"),
     altitude: 950,
     variety: 'Arabica Typica',
     score: 70.5
   },
   { variety: 'Gesha', altitude: 600 },
   { variety: 'Gesha', altitude: 800 },
   { variety: 'Gesha', altitude: 1000 },
   { variety: 'Gesha', altitude: 1200 },
   {
     _id: ObjectId("618c031814fbe03334480478"),
     altitude: 1250,
     variety: 'Gesha',
     score: 88.15
   },
   { variety: 'Gesha', altitude: 1400 },
   { variety: 'Gesha', altitude: 1600 },
   {
     _id: ObjectId("618c031814fbe03334480479"),
     altitude: 1700,
     variety: 'Gesha',
     score: 95.5,
     price: 1029
   },
   { variety: 'Arabica Typica', altitude: 1000 },
   { variety: 'Arabica Typica', altitude: 1200 },
   { variety: 'Arabica Typica', altitude: 1400 },
   { variety: 'Arabica Typica', altitude: 1600 }
 ]

Esta imagem exibe os documentos criados com $densify:

clique para ampliar

Os quadrados mais escuros representam os documentos originais na coleção.
Os quadrados mais claros representam os documentos criados com $densify.

Densificar valores dentro de cada peça

Este exemplo utiliza $densify para somente densificar lacunas no campo altitude dentro de cada variety:

db.coffee.aggregate( [
   {
      $densify: {
         field: "altitude",
         partitionByFields: [ "variety" ],
         range: {
            bounds: "partition",
            step: 200
         }
      }
   }
] )