Docs 菜单
Docs 主页
/
MongoDB Manual
/

时间序列集合最佳实践

在此页面上

  • 优化插件
  • 批量文档写入
  • 在文档中使用一致的字段顺序
  • 增加客端户数量
  • 优化压缩
  • 省略文档中包含空对象和数组的字段
  • 将数值数据四舍五入到小数点后几位
  • 优化查询性能

本页介绍了改善时间序列集合性能和数据使用情况的最佳实践。

要优化时间序列集合的插入性能,请执行以下操作。

插入多个文档时:

例如,如果您具有两个传感器(sensor Asensor B),则包含来自单个传感器的多个测量值的批次产生一个插入的成本,而不是每个测量值一个插入。

以下操作会插入六个文档,但仅产生两次插入的成本(每批一次),因为文档是按传感器排序的。ordered 参数设置为 false,以提升性能:

db.temperatures.insertMany( [
{
"metadata": {
"sensor": "sensorA"
},
"timestamp": ISODate("2021-05-18T00:00:00.000Z"),
temperature: 10
},
{
"metadata": {
"sensor": "sensorA"
},
"timestamp": ISODate("2021-05-19T00:00:00.000Z"),
temperature: 12
},
{
"metadata": {
"sensor": "sensorA"
},
"timestamp": ISODate("2021-05-20T00:00:00.000Z"),
temperature: 13
},
{
"metadata": {
"sensor": "sensorB"
},
"timestamp": ISODate("2021-05-18T00:00:00.000Z"),
temperature: 20
},
{
"metadata": {
"sensor": "sensorB"
},
"timestamp": ISODate("2021-05-19T00:00:00.000Z"),
temperature: 25
},
{
"metadata": {
"sensor": "sensorB"
},
"timestamp": ISODate("2021-05-20T00:00:00.000Z"),
temperature: 26
}
], {
"ordered": false
})

在文档中使用一致的字段顺序,可以提高插入性能。

例如,插入这些文档可实现最佳插入性能:

{
_id: ObjectId("6250a0ef02a1877734a9df57"),
timestamp: 2020-01-23T00:00:00.441Z,
name: 'sensor1',
range: 1
},
{
_id: ObjectId("6560a0ef02a1877734a9df66")
timestamp: 2020-01-23T01:00:00.441Z,
name: 'sensor1',
range: 5
}

相比之下,这些文档无法实现最佳的插入性能,因为其字段顺序不同:

{
range: 1,
_id: ObjectId("6250a0ef02a1877734a9df57"),
name: 'sensor1',
timestamp: 2020-01-23T00:00:00.441Z
},
{
_id: ObjectId("6560a0ef02a1877734a9df66")
name: 'sensor1',
timestamp: 2020-01-23T01:00:00.441Z,
range: 5
}

增加向集合写入数据的客户端数量可以提高性能。

要优化时间序列集合的数据压缩,请执行以下操作。

为优化压缩,如果数据包含空对象或数组,请从省略文档中的空字段。

例如,考虑以下文档:

{
time: 2020-01-23T00:00:00.441Z,
coordinates: [1.0, 2.0]
},
{
time: 2020-01-23T00:00:10.441Z,
coordinates: []
},
{
time: 2020-01-23T00:00:20.441Z,
coordinates: [3.0, 5.0]
}

具有填充值的coordinates字段与空数组之间的交替会导致压缩器的模式发生更改。模式更改会导致序列中的第二个和第三个文档保持未压缩状态。

相比之下,以下省略空数组的文档可获得最佳压缩的好处:

{
time: 2020-01-23T00:00:00.441Z,
coordinates: [1.0, 2.0]
},
{
time: 2020-01-23T00:00:10.441Z
},
{
time: 2020-01-23T00:00:20.441Z,
coordinates: [3.0, 5.0]
}

将数值数据四舍五入到应用程序所需的精度。将数值数据四舍五入到更少的小数位可提高压缩率。

为提升查询性能,请在 timeFieldmetaField创建一个或多个二级索引,以支持常见查询模式。

后退

分片时间序列集合