mongodb的聚合

mongodb的聚合

MongoDB中聚合(aggregate)主要用于处理数据(诸如统计平均值,求和等),并返回计算后的数据结果。有点类似sql语句中的 count(*)。

aggregate() 方法

MongoDB中聚合的方法使用aggregate() 语法

aggregate() 方法的基本语法格式如下所示:

db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)

首先我们新建一个数据库,articleDB,创建一个article的集合

创建数据源输入一下数据

{     
title: 'MongoDB Overview',      
description: 'MongoDB is no sql database',   
by_user: 'w3cschool.cc',   
url: 'http://www.w3cschool.cc',  
tags: ['mongodb', 'database', 'NoSQL'],  
likes: 100  
}, 

{       
title: 'NoSQL Overview',    
description: 'No sql database is very fast',    
by_user: 'w3cschool.cc',   
url: 'http://www.w3cschool.cc',   
tags: ['mongodb', 'database', 'NoSQL'],   
likes: 10  
},  

{    
title: 'Neo4j Overview',  
description: 'Neo4j is no sql database',   
by_user: 'Neo4j',   
url: 'http://www.neo4j.com',  
tags: ['neo4j', 'database', 'NoSQL'],  
likes: 750  
}, 

管道的概念

管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数。

MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。

表达式:处理输入文档并输出。表达式是无状态的,只能用于计算当前聚合管道的文档,不能处理其它的文档。

这里我们介绍一下聚合框架中常用的几个操作:

$group:将集合中的文档分组,可用于统计结果。

$project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。

match:用于过滤数据,只输出符合条件的文档。match使用MongoDB的标准查询操作。

$limit:用来限制MongoDB聚合管道返回的文档数。

$skip:在聚合管道中跳过指定数量的文档,并返回余下的文档。

$unwind:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。

$sort:将输入文档排序后输出。

聚合的表达式:

$sum 计算总和。

db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])

$avg 计算平均值

db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "]$likes"}}}])

$min 获取集合中所有文档对应值得最小值。

db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])

$max 获取集合中所有文档对应值得最大值。

db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])

$push 在结果文档中插入值到一个数组中。

db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])

$first 根据资源文档的排序获取第一个文档数据。

db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])

$last 根据资源文档的排序获取最后一个文档数据

db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])

$group

将集合中的文档分组,可用于统计结果

_id表示分组的依据,使用某个字段的格式为'$字段'

例1:统计每个作家写书的总数

db.article.aggregate([{group:{_id:'by_user',counter:{$sum:1}}}])

例1:统计每个作家的总的点赞数

db.article.aggregate([{$group:{_id:'$by_user',like:{$sum:"$likes"}}}])

Group by null

将集合中所有文档分为一组

例2:求集合中作者总书数量作者的平均点赞数

db.article.aggregate([{$group:{_id:null,counter:{$sum:1},likes:{$avg:"$likes"}}}])

$project

修改输入文档的结构, 可以用来重命名增加或删除域也可以用于创建计算结果以及嵌套文档

db.article.aggregate([{$project:{by_user:1}}])

db.article.aggregate([{$project:{by_user:1,id:0}}])

$match:

用于过滤数据,只输出符合条件的文档。

$match使用MongoDB的标准查询操作

查找集合中书籍点赞量在0到20之间的数,并返回书籍的名称

db.article.aggregate([{$match:{likes:{$gt:0,$lte:20}}},{$project:{title:1,_id:0}}])

思考下面语句的含义?

db.article.aggregate([{match:{likes:{gt:0,lte:20}}},{group:{_id:"by_user",counte:{sum:1},avglikes:{avg:'likes'}}}])

$limit:

用来限制MongoDB聚合管道返回的文档数。

从集合的起始位置查找,限制返回两条

db.article.aggregate({$limit:2})

思考下面语句的含义?

db.article.aggregate([{match:{likes:{gt:0,lte:20}}},{project:{title:1}},{$limit:2}])

$skip在聚合管道中跳过指定数量的文档,并返回余下的文档

db.article.aggregate({$skip:2}) #在聚合管道中跳过指定数量的文档,并返回余下的文档。

db.article.aggregate([{$match:{likes:{$gt:0,$lte:20}}},{$skip:2},{$project:{title:1}}])

db.article.aggregate([{$match:{likes:{$gt:0,$lte:20}}},{$skip:1},{$limit:1},{$project:{title:1}}])

$sort:

将输入文档排序后输出

例:查询出点赞量大于0小于等于800的书籍,并且按照降序排列

db.article.aggregate([{$match:{likes:{$gt:0,$lte:800}}},{$sort:{likes:-1}}])

例:查询出点赞量大于0小于等于800的书籍,并且按照升序排列

db.article.aggregate([{$match:{likes:{$gt:0,$lte:800}}},{$sort:{likes:1}}])

$unwind 将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。

db.article.aggregate([{$unwind:'$tags'}])

思考下面这个语句的含义?

db.article.aggregate([{unwind:'tags'},{$project:{tags:1,title:1,user:1}}])

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,099评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,828评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,540评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,848评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,971评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,132评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,193评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,934评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,376评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,687评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,846评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,537评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,175评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,887评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,134评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,674评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,741评论 2 351

推荐阅读更多精彩内容

  • 我们先介绍一下 MongoDB 的聚合功能,聚合操作主要用于对数据的批量处理,往往将记录按条件分组以后,然后再进行...
    一秆子数码阅读 569评论 0 2
  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 31,915评论 2 89
  • 在mongodb中有时候我们需要对数据进行分析操作,比如一些统计操作,这个时候简单的查询操作(find)就搞不定...
    huan1993阅读 2,569评论 1 1
  • 简介 MongoDB 是一个基于分布式文件存储的NoSQL数据库 由C++语言编写,运行稳定,性能高 旨在为 WE...
    大熊_7d48阅读 36,534评论 1 9
  • 一、MongoDB简介 概述MongoDB是一个基于分布式文件存储的数据库,由C++语言编写。旨在为WEB应用提供...
    EndEvent阅读 1,161评论 1 4