批量写入操作
Overview
MongoDB 为客户端提供批量执行写入操作的功能。批量写入操作影响单个 集合。MongoDB 允许应用程序确定批量写入操作所需的可接受确认级别。
db.collection.bulkWrite()
方法支持执行批量插入、更新和删除操作。
MongoDB 还支持通过 db.collection.insertMany()
方法支持批量插入。
有序操作与无序操作
批量写操作可以是有序的,也可以是无序的。
对于有序的操作列表,MongoDB 以串行方式执行操作。如果在处理其中的一个写入操作期间出现错误,MongoDB 将返回而不处理列表中的任何其余写入操作。请参阅有序的批量写入
对于无序列表的操作,MongoDB 可以并行执行操作,但不能保证这种行为。如果在处理其中一个写入操作期间出现错误,MongoDB 将继续处理列表中剩余的写入操作。请参阅无序批量写入示例。
在分片集合上执行操作的有序列表通常比执行无序列表慢,因为对于有序列表,每个操作都必须等待前一个操作完成。
默认情况下,bulkWrite()
执行 ordered
操作。要指定 unordered
写入操作,请在选项文档中设置 ordered : false
。
参阅操作的执行
bulkWrite () 方法
bulkWrite()
支持以下写入操作:
每个写操作都会作为数组中的一个文档传递给 bulkWrite()
。
例子
本节的示例使用 pizzas
集合:
db.pizzas.insertMany( [ { _id: 0, type: "pepperoni", size: "small", price: 4 }, { _id: 1, type: "cheese", size: "medium", price: 7 }, { _id: 2, type: "vegan", size: "large", price: 8 } ] )
以下 bulkWrite()
示例对 pizzas
集合运行以下操作:
使用
insertOne
添加两个文档。使用
updateOne
更新一个文档。使用
deleteOne
删除文档。使用
replaceOne
替换一个文档。
try { db.pizzas.bulkWrite( [ { insertOne: { document: { _id: 3, type: "beef", size: "medium", price: 6 } } }, { insertOne: { document: { _id: 4, type: "sausage", size: "large", price: 10 } } }, { updateOne: { filter: { type: "cheese" }, update: { $set: { price: 8 } } } }, { deleteOne: { filter: { type: "pepperoni"} } }, { replaceOne: { filter: { type: "vegan" }, replacement: { type: "tofu", size: "small", price: 4 } } } ] ) } catch( error ) { print( error ) }
输出示例,包括已完成操作的摘要:
{ acknowledged: true, insertedCount: 2, insertedIds: { '0': 3, '1': 4 }, matchedCount: 2, modifiedCount: 2, deletedCount: 1, upsertedCount: 0, upsertedIds: {} }
有关更多示例,请参阅bulkWrite() 示例。
批量插入分片集合的策略
大批量插入操作(包括初始数据插入或例行数据导入)可能影响分片集群的性能。对于批量插入,请考虑以下策略:
预拆分集合
如果分片集合为空,此集合将只有一个初始数据段,此数据段位于单个分片上。随后,MongoDB 必须花一些时间接收数据、创建分割以及将分割的数据段分发给可用的分片。为了避免这一性能开销,可以预先分割集合,如分割分片集群中的数据段中所述。
无序写入到 mongos
要提高分片集群的写入性能,请使用 bulkWrite()
并将可选参数 ordered
设置为 false
。mongos
可以尝试将写入操作同时发送到多个分片。对于空 集合,先按照分片集群中的拆分数据段中所述预拆分集合。
避免单调限速
如果分片键在插入期间单调增加,则所有已插入数据都会进入集合中的最后一个数据段,该数据段将始终出现在单个分片上。因此,集群的插入容量永远不会超过该单个分片的插入容量。
如果插入量大于单个分片可以处理的容量,并且无法避免分片键的单调增加,则可以考虑对应用程序进行以下修改:
反转分片键的二进制位。这样将保留信息,并避免将插入顺序与递增的值序列相关联。
交换第一个和最后一个 16 位字,“随机打乱”插入。
例子
以下示例(采用 C++ 编写)交换生成的 BSON ObjectId 的前导和尾随 16 位字,以使其不再单调递增。
using namespace mongo; OID make_an_id() { OID x = OID::gen(); const unsigned char *p = x.getData(); swap( (unsigned short&) p[0], (unsigned short&) p[10] ); return x; } void foo() { // create an object BSONObj o = BSON( "_id" << make_an_id() << "x" << 3 << "name" << "jane" ); // now we may insert o into a sharded collection }