$strLenCP(聚合)
MongoDB5.0 已于 10 月2024 结束生命周期。不再支持此版本的文档。要升级5.0 部署,请参阅 MongoDB6 。0 升级程序。
定义
$strLenCP
版本 3.4 中的新增功能。
返回指定字符串中 UTF-8 代码点 的数量。
{ $strLenCP: <string expression> } 该参数可以是解析为字符串的任何有效表达式。
如果参数解析为
null
的值或指向缺失的字段,$strLenCP
返回错误。例子结果{ $strLenCP: "abcde" }
5
{ $strLenCP: "Hello World!" }
12
{ $strLenCP: "cafeteria" }
9
{ $strLenCP: "cafétéria" }
9
{ $strLenCP: "" }
0
{ $strLenCP: "$€λA" }
4
{ $strLenCP: "寿司" }
2
行为
$strLenCP
操作符计算指定字符串中的代码点数。此行为不同于计算字符串中字节数的 $strLenBytes
操作符,其中每个字符使用 1 到 4 个字节。
例子
单字节和多字节字符集
创建一个 food
集合:
db.food.insertMany( [ { _id: 1, name: "apple" }, { _id: 2, name: "banana" }, { _id: 3, name: "éclair" }, { _id: 4, name: "hamburger" }, { _id: 5, name: "jalapeño" }, { _id: 6, name: "pizza" }, { _id: 7, name: "tacos" }, { _id: 8, name: "寿司" } ] )
以下示例使用 $strLenCP
运算符计算每个 name
值的 length
:
db.food.aggregate( [ { $project: { name: 1, length: { $strLenCP: "$name" } } } ] )
示例输出:
[ { _id: 1, name: 'apple', length: 5 }, { _id: 2, name: 'banana', length: 6 }, { _id: 3, name: 'éclair', length: 6 }, { _id: 4, name: 'hamburger', length: 9 }, { _id: 5, name: 'jalapeño', length: 8 }, { _id: 6, name: 'pizza', length: 5 }, { _id: 7, name: 'tacos', length: 5 }, { _id: 8, name: '寿司', length: 2 } ]