通过聚合转换数据
Overview
在本指南中,您可以学习;了解如何使用MongoDB PHP库执行聚合操作。
聚合操作处理 MongoDB 集合中的数据并返回计算结果。 MongoDB 聚合框架是 Query API 的一部分,以数据处理管道的概念为模型。 文档进入包含一个或多个阶段的管道,该管道将文档转换为聚合结果。
聚合操作类似于汽车工厂。汽车工厂有一条装配线,其中包含配备专用工具的装配站,用于完成特定的工作,例如钻机和焊机。毛坯零件会进入工厂,然后装配线将其转换并组装为成品。
聚合管道是装配线,聚合阶段是装配站,操作符表达式则是专用工具。
聚合与查找操作
您可以使用查找操作执行以下动作:
选择要返回的文档
选择要返回的字段
对结果进行排序
您可以使用聚合操作执行以下动作:
运行查找操作
重命名字段
计算字段
汇总数据
对值进行分组
限制
执行聚合操作时要考虑以下限制:
返回的文档不能违反16 MB 的 BSON文档大小限制。
默认,管道阶段的内存限制为100 MB。 您可以创建一个选项大量,将
allowDiskUse
选项设置为true
,然后将该大量传递给MongoDB\Collection::aggregate()
方法,从而超过此限制。
聚合示例
注意
本指南中的示例使用Atlas示例数据集的sample_restaurants
数据库中的restaurants
集合。 要学习;了解如何创建免费的MongoDB Atlas 群集并加载示例数据集,请参阅Atlas入门指南。
要执行聚合,请将包含管道阶段的大量传递给MongoDB\Collection::aggregate()
方法。
以下代码示例计算纽约每个区的面包店数量。 为此,它使用包含以下阶段的聚合管道:
$pipeline = [ ['$match' => ['cuisine' => 'Bakery']], ['$group' => ['_id' => '$borough', 'count' => ['$sum' => 1]]], ]; $cursor = $collection->aggregate($pipeline); foreach ($cursor as $doc) { echo json_encode($doc), PHP_EOL; }
{"_id":"Brooklyn","count":173} {"_id":"Queens","count":204} {"_id":"Bronx","count":71} {"_id":"Staten Island","count":20} {"_id":"Missing","count":2} {"_id":"Manhattan","count":221}
解释聚合
要查看有关MongoDB如何执行您的操作的信息,您可以指示MongoDB查询规划器对其进行解释。 MongoDB解释操作时,会返回执行计划和性能统计信息。 执行计划是MongoDB完成操作的一种潜在方式。 当您指示MongoDB解释一个操作时,它会返回MongoDB执行的计划和任何被拒绝的执行计划。
要解释聚合操作,请构造一个MongoDB\Operation\Aggregate
对象并将数据库阶段、集合阶段和管道阶段作为参数传递。 然后,将MongoDB\Operation\Aggregate
对象传递给MongoDB\Collection::explain()
方法。
以下示例指示MongoDB解释前面聚合示例中的聚合操作:
$pipeline = [ ['$match' => ['cuisine' => 'Bakery']], ['$group' => ['_id' => '$borough', 'count' => ['$sum' => 1]]], ]; $aggregate = new MongoDB\Operation\Aggregate( $collection->getDatabaseName(), $collection->getCollectionName(), $pipeline ); $result = $collection->explain($aggregate); echo json_encode($result), PHP_EOL;
{"explainVersion":"2","queryPlanner":{"namespace":"sample_restaurants.restaurants", "indexFilterSet":false,"parsedQuery":{"cuisine":{"$eq":"Bakery"}},"queryHash":"865F14C3", "planCacheKey":"D56D6F10","optimizedPipeline":true,"maxIndexedOrSolutionsReached":false, "maxIndexedAndSolutionsReached":false,"maxScansToExplodeReached":false,"winningPlan":{ ... }
更多信息
要查看使用MongoDB PHP库创建复杂聚合管道的教程,请参阅MongoDB开发者中心的使用普通PHP和MongoDB的复杂聚合管道。
MongoDB Server 手册
要学习;了解有关本指南所讨论主题的更多信息,请参阅MongoDB Server手册中的以下页面:
API 文档
要学习;了解有关本指南中讨论的方法的更多信息,请参阅以下API文档: