$binarySize(聚合)
定义
$binarySize
返回给定字符串或二进制数据值内容的大小(以字节为单位)。
$binarySize
通过以下语法实现:{ $binarySize: <string or binData> }
行为
$binarySize
的参数必须解析为:
一个字符串,
二进制数据值,或
null。
如果参数是字符串或二进制数据值,则表达式返回参数的大小(以字节为单位)。
如果参数为null
,则表达式返回null
。
如果参数解析为其他数据类型,$binarySize
会出错。
字符串大小计算
如果 $binarySize
的参数是字符串,操作符会计算字符串中采用 UTF-8 编码的字节数,其中每个字符可能使用 1 到 4 个字节。
示例,US-ASCII 字符使用一个字节进行编码。 带有变音符号的字符和其他拉丁字母字符(英语字母表之外的拉丁字符)使用两个字节进行编码。 中文、日文和韩文字符通常需要三个字节,而其他平面的 unicode(表情符号、数学符号等)需要四个字节。
以以下示例为例:
例子 | 结果 | 注意 | |
---|---|---|---|
| 5 | 每个字符使用一个字节进行编码。 | |
| 12 | 每个字符使用一个字节进行编码。 | |
| 9 | 每个字符使用一个字节进行编码。 | |
| 11 | é 使用两个字节进行编码。 | |
| 0 | 空字符串返回 0。 | |
| 7 | € 使用三个字节进行编码。 λ 使用两个字节进行编码。 | |
| 6 | 每个字符使用三个字节进行编码。 |
例子
在 mongosh
中创建名为 images
的示例集合,其中包含以下文档:
db.images.insertMany([ { _id: 1, name: "cat.jpg", binary: new BinData(0, "OEJTfmD8twzaj/LPKLIVkA==")}, { _id: 2, name: "big_ben.jpg", binary: new BinData(0, "aGVsZmRqYWZqYmxhaGJsYXJnYWZkYXJlcTU1NDE1Z2FmZCBmZGFmZGE=")}, { _id: 3, name: "tea_set.jpg", binary: new BinData(0, "MyIRAFVEd2aImaq7zN3u/w==")}, { _id: 4, name: "concert.jpg", binary: new BinData(0, "TWFuIGlzIGRpc3Rpbmd1aXNoZWQsIG5vdCBvbmx5IGJ5IGhpcyByZWFzb24sIGJ1dCBieSB0aGlzIHNpbmd1bGFyIHBhc3Npb24gZnJvbSBvdGhlciBhbmltYWxzLCB3aGljaCBpcyBhIGx1c3Qgb2YgdGhlIG1pbmQsIHRoYXQgYnkgYSBwZXJzZXZlcmFuY2Ugb2YgZGVsaWdodCBpbiB0aGUgY29udGludWVkIGFuZCBpbmRlZmF0aWdhYmxlIGdlbmVyYXRpb24gb2Yga25vd2xlZGdlLCBleGNlZWRzIHRoZSBzaG9ydCB2ZWhlbWVuY2Ugb2YgYW55IGNhcm5hbCBwbGVhc3VyZS4=")}, { _id: 5, name: "empty.jpg", binary: new BinData(0, "") } ])
以下聚合projects
:
name
字段imageSize
字段,它使用$binarySize
返回以字节为单位的文档binary
字段的大小。
db.images.aggregate([ { $project: { "name": "$name", "imageSize": { $binarySize: "$binary" } } } ])
操作返回以下结果:
{ "_id" : 1, "name" : "cat.jpg", "imageSize" : 16 } { "_id" : 2, "name" : "big_ben.jpg", "imageSize" : 41 } { "_id" : 3, "name" : "teaset.jpg", "imageSize" : 16 } { "_id" : 4, "name" : "concert.jpg", "imageSize" : 269 } { "_id" : 5, "name" : "empty.jpg", "imageSize" : 0 }
查找最大的二进制数据
以下管道返回具有最大二进制数据大小的图像:
db.images.aggregate([ // First Stage { $project: { name: "$name", imageSize: { $binarySize: "$binary" } } }, // Second Stage { $sort: { "imageSize" : -1 } }, // Third Stage { $limit: 1 } ])
- 第一个阶段:
name
字段imageSize
字段,它使用$binarySize
返回以字节为单位的文档binary
字段的大小。
此阶段将以下文档输出到下一阶段:
{ "_id" : 1, "name" : "cat.jpg", "imageSize" : 16 } { "_id" : 2, "name" : "big_ben.jpg", "imageSize" : 41 } { "_id" : 3, "name" : "teaset.jpg", "imageSize" : 16 } { "_id" : 4, "name" : "concert.jpg", "imageSize" : 269 } { "_id" : 5, "name" : "empty.jpg", "imageSize" : 0 } - 第二阶段
第二阶段按
sorts
imageSize
文档。此阶段将以下文档输出到下一阶段:
{ "_id" : 4, "name" : "concert.jpg", "imageSize" : 269 } { "_id" : 2, "name" : "big_ben.jpg", "imageSize" : 41 } { "_id" : 1, "name" : "cat.jpg", "imageSize" : 16 } { "_id" : 3, "name" : "teaset.jpg", "imageSize" : 16 } { "_id" : 5, "name" : "empty.jpg", "imageSize" : 0 } - 第三个阶段
第三阶段
limits
输出文档,仅返回按排序顺序排在第一位的文档:{ "_id" : 4, "name" : "concert.jpg", "imageSize" : 269 }