MongoDB 聚合(aggregate)
聚合(aggregat)
聚合(aggregat)操作处理数据记录并返回计算结果。聚合(aggregate)操作将来自多个文档的值分组在一起,并且可以对分组的数据执行各种操作以返回单个结果。在SQL中,count(*)和group by等效于MongoDB聚合(aggregat)。
aggregate()方法
对于MongoDB中的聚合,您应该使用aggregate()方法。
aggregate()方法的基本语法如下
>db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)
示例
在集合中,您具有以下数据-
{ "_id" : ObjectId("5f48a73256d3cce3c9126fda"), "title" : "PHP 教程", "author" : "李四", "phone" : "10086", "uid" : 7 }
{ "_id" : ObjectId("5f48a73256d3cce3c9126fdb"), "title" : "Python 教程", "author" : "王五", "phone" : "19999999999", "uid" : 8 }
{ "_id" : ObjectId("5f48a73256d3cce3c9126fdc"), "title" : "Python 教程", "author" : "赵六", "phone" : "18888888888", "uid" : 9 }
现在从上面的集合中,如果您想显示一个列表,说明每个统计相同的教程有多少用户写过,那么您将使用下面的aggregate()方法:
>db.empDetails.aggregate([{$group : {_id : "$title", num_tutorial : {$sum : 1}}}]);
{ "_id" : "PHP 教程", "num_tutorial" : 1 }
{ "_id" : "Python 教程", "num_tutorial" : 2 }
以上用例的等效Sql查询为
SELECT title,count(*) FORM empDetails GROUP BY title
。
在上面的示例中,我们已经按字段title对文档进行了分组,并且在每次出现时按用户将sum按先前值递增。以下是可用的聚合表达式的列表。
表达 | 描述 | 例子 |
---|---|---|
$sum | 从集合中的所有文档中汇总定义的值。 | db.empDetails.aggregate([{$ group:{_id:“ $title”,num_tutorial:{$sum:“$likes”}}}])) |
$avg | 计算集合中所有文档的所有给定值的平均值。 | db.empDetails.aggregate([[$$ group:{_id:“ $title”,num_tutorial:{$avg:“$likes”}}}])) |
$min | 从集合中的所有文档中获取最小的对应值。 | db.empDetails.aggregate([[$$ group:{_id:“ $title”,num_tutorial:{$min:“$likes”}}}])) |
$max | 从集合中的所有文档中获取相应值的最大值。 | db.empDetails.aggregate([{$ group:{_id:“ $title”,num_tutorial:{$max:“$likes”}}}])) |
$push | 将值插入结果文档中的数组。 | db.empDetails.aggregate([{$ group:{_id:“ $title”,url:{$push:“$url”}}}])) |
$addToSet | 将值插入结果文档中的数组,但不创建重复项。 | db.empDetails.aggregate([[$$ group:{_id:“ $title”,url:{$addToSet:“$url”}}}])) |
$first | 根据分组从源文档中获取第一个文档。通常,这与以前应用的“$sort”一起才有意义。 | db.empDetails.aggregate([[$$ group:{_id:“$title”,first_url:{$first:“$url”}}}])) |
$last | 根据分组从源文档中获取最后一个文档。通常,这与以前应用的“$sort”一起才有意义。 | db.empDetails.aggregate([[$$ group:{_id:“$title”,last_url:{$last:“$url”}}}])) |
管道概念
在UNIX命令中,shell 管道意味着可以对某些输入执行操作,并将输出用作下一条命令的输入,依此类推。MongoDB在聚合框架中也支持相同的概念。有一组可能的阶段,每个阶段都作为一组文档作为输入,并生成一组结果文档(或在管道末尾生成最终的JSON文档)。然后可以将其用于下一阶段,依此类推。
以下是聚合框架中的可能阶段-
- $project-用于从集合中选择一些特定字段。
- $match-这是一个过滤操作,因此可以减少作为下一阶段输入的文档数量。
- $group-这将执行如上所述的实际聚合。
- $sort-对文档进行排序。
- $skip-这样,可以在给定数量的文档中向前跳过文档列表。
- $limit-从当前位置开始,以给定的数量限制要查看的文档数量。
- $unwind-用于展开使用数组的文档。当使用数组时,数据是一种预连接的,并且此操作将被撤消以再次具有单独的文档。因此,在本阶段中,我们将增加下一阶段的文档数量。