03-MongoDB

一、MongoDB简介

1.概述

​ MongoDB是一个基于分布式文件存储的数据库,由C++语言编写。旨在为WEB应用提供可扩展的高性能数据存储解决方案。

MongoDB介于关系型数据和非关系型数据库之间,是非关系数据库当中功能最丰富,最像关系数据库的。他支持的数据结构非常松散,类似json格式,因此可以存储比较复杂的数据类型。

MongoDB最大的特点是他支持的查询语言非常强大,其语法有点类似于面向对象的查询语言,几乎可以实现类似关系数据库表单查询的绝大部分功能,而且还支持对数据建立索引。

2.和MySQL之间的区别

2.1MySQL

关系型数据库。
查询语句是使用传统的sql语句,拥有较为成熟的体系,成熟度很高。
关系型数据库遵循ACID规则
开源数据库的份额在不断增加,mysql的份额页在持续增长。
缺点:在海量数据处理的时候效率会显著变慢。

2.2MongoDB

非关系型数据库(nosql ),属于文档型数据库。先解释一下文档的数据库,即可以存放xml、json、bson类型系那个的数据。这些数据具备自述性(self-describing),呈现分层的树状数据结构。数据结构由键值(key=>value)对组成。
存储方式:虚拟内存+持久化。
查询语句:是独特的Mongodb的查询方式。
适合场景:事件的记录,内容管理或者博客平台等等。
数据处理:数据是存储在硬盘上的,只不过需要经常读取的数据会被加载到内存中,将数据存储在物理内存中,从而达到高速读写。
成熟度与广泛度:新兴数据库,成熟度较低,Nosql数据库中最为接近关系型数据库,比较完善的DB之一,适用人群不断在增长。
优势:
快速!在适量级的内存的Mongodb的性能是非常迅速的,它将热数据存储在物理内存中,使得热数据的读写变得十分快,
高扩展!
自身的Failover机制!
json的存储格式!

2.3二者之间的区别
MySQL MongoDB 解释
database database 数据库
table collection 数据表/集合
row【一条记录,实体】 document 行/文档
column field 列/字段或者属性
table join 不支持 表连接
primary key primary key 主键

解释

数据库:容器,不管是mysql还是mongodb,一个单一的服务器都可以管理多个数据库

集合:是一组mongodb的文件,等价于mysql中的table,集合中文档可以有不同的字段,也可以有不同的数据类型

文档:一组键值对,具有动态模式【不同的数据可以是不同的格式】

二、MongoDB安装和卸载

1.卸载

执行命令:
sudo apt-get autoremove mongodb
sudo apt-get autoclean mongodb

#清除残留数据
dpkg -l |grep ^rc|awk '{print $2}' |tr ["\n"] [" "]|sudo xargs dpkg -P 

2.安装

第1步 – 导入公钥**

Ubuntu软件包管理器apt(高级软件包工具)需要软件分销商的GPG密钥来确保软件包的一致性和真实性。 执行此下面的命令将MongoDB密钥导入到您的服务器:

sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv 2930ADAE8CAF5059EE73BB4B58712A2291FA4AD5

第2步 – 创建源列表文件MongoDB

检查URL http://repo.mongodb.org/apt/ubuntu/dists/。 如果您在该网页上看到一个目录“bionic”,则将下述命令中的单词“xenial”替换为“bionic”一词,【原因:MongoDB尚未发布Bionic Beaver软件包,但Xenial软件包在Ubuntu 18.04 LTS上运行良好】

执行以下命令在/etc/apt/sources.list.d/中创建一个MongoDB列表文件:

echo "deb http://repo.mongodb.org/apt/ubuntu xenial/mongodb-org/3.6 multiverse" | sudo tee /etc/apt/sources.list.d/mongodb-org-3.6.list

第3步 – 更新存储库

使用apt命令更新存储库:

sudo apt-get update

说明:执行完会提示一些失败,不用在意

第4步 – 安装MongoDB

执行以下命令来安装MongoDB:

sudo apt-get install -y mongodb

第5步:启动MongoDB

执行以下命令启动MongoDB并将其添加为在启动时启动的服务

systemctl start mongodb

如果执行完这一步终端没有任何输出,则说明是正确的
如果启动的时候提示:Failed to start mongod.service: Unit mongodb.service not found.
解决办法如下:
  1创建配置文件:
      在/etc/systemd/system/下
      sudo vim mongodb.service

  2.在里面追加文本:
      [Unit]
      Description=High-performance, schema-free document-oriented database
      After=network.target
   
      [Service]
      User=mongodb
      ExecStart=/usr/bin/mongod --quiet --config /etc/mongodb.conf
   
      [Install]
      WantedBy=multi-user.target
  3.按ctrl+X退出
  4.启动服务
      sudo systemctl start mongodb
      sudo systemctl status mongodb
  5.让它永久启动
      sudo systemctl enable mongodb
第6步:检查MongoDB是否已经启动在27017端口号上

执行下面的命令:

netstat -plntu

第7步:登录MongoDB

mongo

如果出现错误全局初始化失败:BadValue无效或无用户区域设置。 请确保LANG和/或LC_ *环境变量设置正确,请尝试命令:
  export LC_ALL=C
  mongo

补充:ubuntu下如何查看软件安装目录以及安装版本

1.查询版本
aptitude show 软件名  或者 dpkg -l软件名
2.查询安装路径
dpkg -L 软件名  或者 whereis 软件名

三、MongoDB使用

1.创建和删除数据库

1.1创建数据库

语法:

use DATABASE_NAME
注意:如果指定的数据库DATABASE_NAME不存在,则该命令将创建一个新的数据库,否则返回现有的数据库

#mysql中
创建数据库:create database basename;
切换数据库:use basename;

数据库命名:

​ a.不能是空字符串

​ b.不能包含特殊符号

​ c.最好全部小写

​ d.有一些数据库名是保留的,可以直接访问特殊数据库

​ admin:从权限的角度来说,是root的数据库

​ local:本地数据

​ config:配置,用于保存MongoDB的配置信息

演示:

#登录MongoDB                                                       rock@rockrong:~$ mongo
MongoDB shell version: 2.6.10
connecting to: test
Welcome to the MongoDB shell.
For interactive help, type "help".
For more comprehensive documentation, see
  http://docs.mongodb.org/
Questions? Try the support group
  http://groups.google.com/group/mongodb-user
#创建数据库并切换到该数据库下
> use mydb1   
switched to db mydb1

其他命令:

#检查当前选择的数据库
> db
mydb1

#检查已经创建好的数据库列表
> show dbs
admin  (empty)
local  0.078GB

#创建的数据库(newdb)不在列表中。要显示数据库,需要至少插入一个文档,空的数据库是不显示出来的
> db.mydb1.insert({'name':'yangyang'})
WriteResult({ "nInserted" : 1 })
> show dbs
admin  (empty)
local  0.078GB
mydb1  0.078GB

#退出MongoDB
> exit
bye
rock@rockrong:~$ mongo
MongoDB shell version: 2.6.10
#默认的数据库test
connecting to: test

#如果数据库已经存在,use表示切换数据库
> use mydb1
switched to db mydb1
1.2删除数据库

语法:

db.dropDatabase()

#注意:默认删除当前正在工作的数据库,如果没有通过use命令切换数据库,则删除的是test

演示:

#删除当前正在工作的数据库
> db.dropDatabase()
{ "dropped" : "mydb1", "ok" : 1 }
> show dbs
admin  (empty)
local  0.078GB

2.创建和删除集合

类似于MySQL中的表

集合存在于数据库中,集合没有固定的结构,意味着可以对集合插入不同格式和不同类型的数据,但是尽量插入集合的时候保证数据的关联性

集合名的规范:

​ a.不能空字符串

​ b.集合名不能含有\0【空字符】,表示集合名的结尾

​ c.集合名不能以"system."开头,为系统集合保留的关键字

​ d.不能含有保留字符,千万不能含有$

2.1创建集合

语法:

db.createCollection(name, options)

#注意
name的类型为String,是要创建的集合的名称
options的类型是Document,是一个文档,指定相应的大小和索引,是可选参数

下面是可以使用的选项列表:

在插入文档时,MongoDB首先检查上限集合capped字段的大小,然后检查max字段。

字段 类型 描述
capped Boolean (可选)如果为true,则启用封闭的集合。上限集合是固定大小的集合,它在达到其最大大小时自动覆盖其最旧的条目。 如果指定true,则还需要指定size参数。
autoIndexId Boolean (可选)如果为true,则在_id字段上自动创建索引。默认值为false
size 数字 (可选)指定上限集合的最大大小(以字节为单位)。 如果cappedtrue,那么还需要指定此字段的值。
max 数字 (可选)指定上限集合中允许的最大文档数。

演示:

> use test
switched to db test

#没有options选项的集合的创建
> db.createCollection("myCollection")
{ "ok" : 1 }

#显示当前数据库下的集合列表
> show collections
myCollection
system.indexes

#有options选项的集合的创建
> db.createCollection("mycol",{capped:true,autoIndexId:true,size:1024,max:10000})
{ "ok" : 1 }
> show collections
myCollection
mycol
system.indexes

#如果一个集合不存在,直接向其中插入数据,会自动创建
> db.newcollection.insert({'name':'zhangsan'})
WriteResult({ "nInserted" : 1 })
> show collections
myCollection
mycol
newcollection
system.indexes
2.2删除集合

语法:

db.COLLECTION_NAME.drop()

注意:如果选定的集合成功删除,drop()方法将返回true,否则返回false

演示:

> db.newcollection.drop()
true
> show collections
myCollection
mycol

3.文档操作

文档:相当表中的一条记录【实体】

是一组键值对,文档不需要设置相同的字段,并且相同的字段不需要相同的数据类型

注意:

​ a.文档中的键值对是有序的

​ b.文档中值除了字符串之外,还可以是其他数据类型【嵌套一个文档】

​ c.严格区分大小写和数据类型的,mycol myCol

​ d.文档中不能有重复的键

​ e.文档中的键基本都是用字符串表示的

文档中键的命名:

​ a.键不能包含\0

​ b.$和.有特殊含义

​ c.以下划线开头的键是保留的,尽量不要使用下划线开头

3.1插入文档

语法:

db.COLLECTION_NAME.insert(document)

注意:在插入的文档中,如果不指定_id参数,那么 MongoDB 会为此文档分配一个唯一的ObjectId

_id为集合中的每个文档唯一的12个字节的十六进制数。 12字节划分如下

_id: ObjectId(4 bytes timestamp, 3 bytes machine id, 2 bytes process id, 
   3 bytes incrementer)

演示:

#插入单条文档
> db.mycol.insert({
   id:100,
   name:'zhangsan',
  age:18,
  hobby:'sing',
  })
WriteResult({ "nInserted" : 1 })

#查看已经插入的文档
> db.mycol.find()
{ "_id" : ObjectId("5b3d8c919e00ffe8882d9705"), "id" : 100, "name" : "zhangsan", "age" : 18, "hobby" : "sing" }
> db.mycol.find().pretty()
{
  "_id" : ObjectId("5b3d8c919e00ffe8882d9705"),
  "id" : 100,
  "name" : "zhangsan",
  "age" : 18,
  "hobby" : "sing"
}

#批量插入文档
#直接写文档,只能插入一条
> db.mycol.insert({ id:101, name:"lisi", age:20, hobby:'dance', },{ id:102, name:'jack', age:15, hobby:'write', })
WriteResult({ "nInserted" : 1 })

#用数组可以插入多条
> db.check.insert([
      {
         _id: 101,
         title: 'MongoDB Guide', 
         description: 'MongoDB is no sql database',
         by: 'yiibai tutorials',
         url: 'http://www.yiibai.com',
         tags: ['mongodb', 'database', 'NoSQL'],
         likes: 100
      },
  
      {
        _id: 102,
         title: 'NoSQL Database', 
         description: "NoSQL database doesn't have tables",
         by: 'yiibai tutorials',
         url: 'http://www.yiibai.com',
         tags: ['mongodb', 'database', 'NoSQL'],
         likes: 210, 
         comments: [
            {
               user:'user1',
               message: 'My first comment',
               dateCreated: new Date(2017,11,10,2,35),
               like: 0 
            }
         ]
      },
      {
         _id: 104,
         title: 'Python Quick Guide', 
         description: "Python Quick start ",
         by: 'yiibai tutorials',
         url: 'http://www.yiibai.com',
         tags: ['Python', 'database', 'NoSQL'],
         likes: 30, 
         comments: [
            {
               user:'user1',
               message: 'My first comment',
               dateCreated: new Date(2018,11,10,2,35),
               like: 590 
            }
         ]
     }
  ])
BulkWriteResult({
  "writeErrors" : [ ],
  "writeConcernErrors" : [ ],
  "nInserted" : 3,
  "nUpserted" : 0,
  "nMatched" : 0,
  "nModified" : 0,
  "nRemoved" : 0,
  "upserted" : [ ]
})
> db.check.find().pretty()
{
  "_id" : 101,
  "title" : "MongoDB Guide",
  "description" : "MongoDB is no sql database",
  "by" : "yiibai tutorials",
  "url" : "http://www.yiibai.com",
  "tags" : [
      "mongodb",
      "database",
      "NoSQL"
  ],
  "likes" : 100
}
{
  "_id" : 102,
  "title" : "NoSQL Database",
  "description" : "NoSQL database doesn't have tables",
  "by" : "yiibai tutorials",
  "url" : "http://www.yiibai.com",
  "tags" : [
      "mongodb",
      "database",
      "NoSQL"
  ],
  "likes" : 210,
  "comments" : [
      {
          "user" : "user1",
          "message" : "My first comment",
          "dateCreated" : ISODate("2017-12-09T18:35:00Z"),
          "like" : 0
      }
  ]
}
{
  "_id" : 104,
  "title" : "Python Quick Guide",
  "description" : "Python Quick start ",
  "by" : "yiibai tutorials",
  "url" : "http://www.yiibai.com",
  "tags" : [
      "Python",
      "database",
      "NoSQL"
  ],
  "likes" : 30,
  "comments" : [
      {
          "user" : "user1",
          "message" : "My first comment",
          "dateCreated" : ISODate("2018-12-09T18:35:00Z"),
          "like" : 590
      }
  ]
}
>
其它插入文档的方法【作为了解】

db.collection.insertOne():插入单个文档

db.collection.insertMany():插入多个文档

a.db.collection.insertOne()方法

db.collection.insertOne()方法将单个文档插入到集合中。 如果文档没有指定_id字段,MongoDB会自动将_id字段与ObjectId`值添加到新文档

演示:

#以下示例将新文档插入到库存集合中
db.invent.insertOne({ 
       item: "canvas", 
       num: 100, 
       tags: ["cotton"], 
       size: { 
            h: 20,
            w: 30, 
        } 
})


#db.collection.insertOne()方法返回包含新插入的文档的`_id```字段值的文档

执行结果如下:
> db.inventory.insertOne(
      { item: "canvas", qty: 100, tags: ["cotton"], size: { h: 28, w: 35.5, uom: "cm" } }
   )
{
        "acknowledged" : true,
        "insertedId" : ObjectId("5955220846be576f199feb55")
}
>

b.db.collection.insertMany()方法

db.collection.insertMany()方法将多个文档插入到集合中,可将一系列文档传递给db.collection.insertMany()方法。以下示例将三个新文档插入到库存集合中。如果文档没有指定_id字段,MongoDB会向每个文档添加一个ObjectId值的_id`字段

演示:

db.inventory.insertMany([
   { item: "journal", qty: 25, tags: ["blank", "red"], size: { h: 14, w: 21, uom: "cm" } },
   { item: "mat", qty: 85, tags: ["gray"], size: { h: 27.9, w: 35.5, uom: "cm" } },
   { item: "mousepad", qty: 25, tags: ["gel", "blue"], size: { h: 19, w: 22.85, uom: "cm" } }
])

#insertMany()返回包含新插入的文档_id字段值的文档。执行结果如下:
> db.inventory.insertMany([
      { item: "journal", qty: 25, tags: ["blank", "red"], size: { h: 14, w: 21, uom: "cm" } },
      { item: "mat", qty: 85, tags: ["gray"], size: { h: 27.9, w: 35.5, uom: "cm" } },
      { item: "mousepad", qty: 25, tags: ["gel", "blue"], size: { h: 19, w: 22.85, uom: "cm" } }
   ])
{
        "acknowledged" : true,
        "insertedIds" : [
                ObjectId("59552c1c46be576f199feb56"),
                ObjectId("59552c1c46be576f199feb57"),
                ObjectId("59552c1c46be576f199feb58")
        ]
}
3.2查询文档

语法:

db.COLLECTION_NAME.find(document)

注意:
find()将以非结构化的方式返回查询结果

要以格式化的方式返回查询结果,可以结合pretty函数使用
db.COLLECTION_NAME.find(document).pretty()

findOne():返回一个文档
MongoDB 与 RDBMS的等效MySQL子句

要在一些条件的基础上查询文档,可以使用以下操作:

操作 语法 示例 MySQL等效语句
相等 {<key>:<value>} db.mycol.find({"by":"yiibai"}).pretty() where by = 'yiibai'
小于 {<key>:{$lt:<value>}} db.mycol.find({"likes":{$lt:50}}).pretty() where likes < 50
小于等于 {<key>:{$lte:<value>}} db.mycol.find({"likes":{$lte:50}}).pretty() where likes <= 50
大于 {<key>:{$gt:<value>}} db.mycol.find({"likes":{$gt:50}}).pretty() where likes > 50
大于等于 {<key>:{$gte:<value>}} db.mycol.find({"likes":{$gte:50}}).pretty() where likes >= 50
不等于 {<key>:{$ne:<value>}} db.mycol.find({"likes":{$ne:50}}).pretty() where likes != 50

演示:

a.MongoDB中的AND操作符

语法:

#在find()方法中,如果通过使用’,‘将它们分开传递多个键,则 MongoDB 将其视为AND条件。 以下是AND的基本语法
>db.mycol.find(
   {
      $and: [
         {key1: value1}, {key2:value2}
      ]
   }
).pretty()

演示:

#第一种表示and:  $and[{键值对},{键值对}]
db.check.find({$and:[{'by':'yiibai tutorials'},{'title':'Python Quick Guide'}]}).pretty()
{
  "_id" : 104,
  "title" : "Python Quick Guide",
  "description" : "Python Quick start ",
  "by" : "yiibai tutorials",
  "url" : "http://www.yiibai.com",
  "tags" : [
      "Python",
      "database",
      "NoSQL"
  ],
  "likes" : 30,
  "comments" : [
      {
          "user" : "user1",
          "message" : "My first comment",
          "dateCreated" : ISODate("2018-12-09T18:35:00Z"),
          "like" : 590
      }
  ]
}
> 

#第二种表示and:{键值对,键值对}
 db.check.find({'by':'yiibai tutorials','title':'Python Quick Guide'}).pretty()

{
  "_id" : 104,
  "title" : "Python Quick Guide",
  "description" : "Python Quick start ",
  "by" : "yiibai tutorials",
  "url" : "http://www.yiibai.com",
  "tags" : [
      "Python",
      "database",
      "NoSQL"
  ],
  "likes" : 30,
  "comments" : [
      {
          "user" : "user1",
          "message" : "My first comment",
          "dateCreated" : ISODate("2018-12-09T18:35:00Z"),
          "like" : 590
      }
  ]
}

#等效的SQL的语句
select * from check where by="" and title="";

b.MongoDB中的OR操作符

语法:

#在要根据OR条件查询文档,需要使用$or关键字。 以下是OR条件的基本语法
>db.mycol.find(
   {
      $or: [
         {key1: value1}, {key2:value2}
      ]
   }
).pretty()

演示:

 db.check.find({$or:[{'by':'yiibai tutorials'},{'title':'Python Quick Guide'}]}).pretty()

c.使用 AND 和 OR 联合使用

演示:

> db.check.find({'likes':{$gt:100},$or:[{'title':'NoSQL Database'},{'by':'yiibai tutorials'}]}).pretty()
{
  "_id" : 102,
  "title" : "NoSQL Database",
  "description" : "NoSQL database doesn't have tables",
  "by" : "yiibai tutorials",
  "url" : "http://www.yiibai.com",
  "tags" : [
      "mongodb",
      "database",
      "NoSQL"
  ],
  "likes" : 210,
  "comments" : [
      {
          "user" : "user1",
          "message" : "My first comment",
          "dateCreated" : ISODate("2017-12-09T18:35:00Z"),
          "like" : 0
      }
  ]
}
> 
select * from check where likes>100 and (title='' or by='')
3.3更新文档

1>update():更新现有文档中的值

criteria:用于指定一个查询,查询选择将要更新的目标记录

action:用于指定更新信息,也可以使用操作符完成

options:

语法:

db.COLLECTION_NAME.update(SELECTION_CRITERIA, UPDATED_DATA)

演示:

#find():查询指定列的数据
#{'_id':1,'title':1}:表示要检索的字段列表
#注意:当执行find函数的时候,它默认将所有的文档显示,为了限制显示的字段,需要将字段列表的值设置为1,如果不显示可以设置为0
> db.check.find({'title':'MongoDB Guide'},{'_id':1,'title':1})
{ "_id" : 101, "title" : "MongoDB Guide" }

#注意:update默认只更新一个文档,如果要更新多个文档,则添加参数{multi:true})
db.check.update({'title':'MongoDB Guide'},{$set:{'title':'aaaaaa'}},{multi:true})

2>save():使用save()方法中传递的文档数据替换现有文档

语法:

>db.COLLECTION_NAME.save({_id:ObjectId(),NEW_DATA})

演示:

> use mydb1
switched to db mydb1
> db.check.save({'_id':102,'titlt':'bbbb','by':'hello'})
WriteResult({ "nMatched" : 0, "nUpserted" : 1, "nModified" : 0, "_id" : 102 })
> db.check.find({'_id':102},{'_id':1,'title':1,'by':1})
{ "_id" : 102, "by" : "hello" }
3.4删除文档

MongoDB中的 remove()方法用于从集合中删除文档。 remove()方法接受两个参数。 一个是删除条件,第二个是标志:justOne

​ criteria - (可选)符合删除条件的集合将被删除。

​ justOne - (可选)如果设置为true1,则只删除一个文档

语法:

>db.COLLECTION_NAME.remove(DELLETION_CRITTERIA)

演示:

> db.check.remove({'_id':100})
WriteResult({ "nRemoved" : 0 })
> db.check.find({},{'_id':1,'title':1})
{ "_id" : 102 }
> db.check.remove()
2018-07-05T15:02:29.068+0800 remove needs a query at src/mongo/shell/collection.js:299
> db.check.find({},{'_id':1,'title':1})
{ "_id" : 102 }
> db.check.find().pretty()

4.查询

4.1投影

投影:查询过程中,只显示指定的字段

语法:

>db.COLLECTION_NAME.find({},{KEY:1})

演示:

#在查询文档时只显示文档的标题
> db.mycol.find({}, {'title':1,'_id':0})

##注意,在执行find()方法时,始终都会显示_id字段,如果不想要此字段,则需要将其设置为0
#只能为全1或全0,但是对于_id,可以不受此限制
4.2限制筛选记录

1>limit方法

作用:限制MongoDB要返回的记录数

根据指定的参数返回记录数

语法:

> db.COLLECTION_NAME.find().limit(NUMBER)

演示:

#在查询文档时仅显示两个文档
> db.mycol.find({},{"title":1,_id:0}).limit(2)

2>skip方法

语法:

>db.COLLECTION_NAME.find().limit(NUMBER).skip(NUMBER)

演示:

> db.mycol.find({},{"title":1,_id:0}).limit(1).skip(2)
#先跳过2条,再总共显示1条
#注意:skip()方法中的默认值为0。
4.3对查询记录排序

语法:

>db.COLLECTION_NAME.find().sort({KEY:1})

注意:使用指定顺序进行排序,1表示升序,-1表示降序

演示:

> db.mycol.find({},{'_id':1, 'title':1})
# 按`title`降序排序
> db.mycol.find({},{"title":1,_id:0}).sort({"title":-1})
# 按`title`降序排序
> db.mycol.find({},{"title":1,_id:0}).sort({"title":-1})
4.4分组与聚合函数查询

1>aggregate()方法

语法:

>db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)

以下是可用聚合表达式的列表。

表达式 描述 示例
$sum 从集合中的所有文档中求出定义的值。 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}])
$avg 计算集合中所有文档的所有给定值的平均值。 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}])
$min 从集合中的所有文档获取相应值的最小值。 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}])
$max 从集合中的所有文档获取相应值的最大值。 db.mycol.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}])
$push 将值插入到生成的文档中的数组中。 db.mycol.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}])
$addToSet 将值插入生成的文档中的数组,但不会创建重复项。 db.mycol.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}])
$first 根据分组从源文档获取第一个文档。 通常情况下,这只适用于以前应用的“$sort”阶段。 db.mycol.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}])
$last 根据分组从源文档获取最后一个文档。通常情况下,这只适用于以前应用的“$sort”阶段。 db.mycol.aggregate([{$group : {_id : "$by_user", last_url : {$last : "$url"}}}])

演示:

 db.article.aggregate([{$group:{'_id':'$by_user','num_tutorial':{$sum:1}}}])
{ "_id" : "Curry", "num_tutorial" : 1 }
{ "_id" : "Kuber", "num_tutorial" : 1 }
{ "_id" : "Maxsu", "num_tutorial" : 2 }

#等效的sql语句
select  by_user, count(*) as num_tutorial from article group by by_user

管道:

每一组的输出可以作为另一组的输入,并且生成一组新的文档

$sort

$limit

$skip

$group

5.MongoDB关联关系

MongoDB中的关系表示各个文档在逻辑上的相互关联。关系可以通过嵌入式和引用方法建模。 这种关系可以是1:11:NN:1N:N

假设有一种情况:要存储用户的地址。一个用户可以拥有多个地址,这就是1:N关系。

以下是用户(user)文档示例的文档结构

{
   "_id":10999110,
   "name": "Maxsu",
   "contact": "13888990021",
   "dob": "1992-10-11"
}

以下是地址(address)文档的示例文档结构 -

{
   "_id":12200,
   "building": "Hainan Building NO.2100",
   "pincode": 571100,
   "city": "Haikou",
   "province": "Hainan"
}
5.1嵌入式关系建模

在嵌入式方法中,我们将地址(address)文档嵌入到用户(user)文档中。

{
   "_id": 21000100,
   "contact": "13800138000",
   "dob": "1991-11-11",
   "name": "Maxsu",
   "address": [
      {
         "building": "Hainan Building NO.2100",
         "pincode": 571100,
         "city": "Haikou",
         "province": "Hainan"
      },
      {
         "building": "Sanya Building NO.2100",
         "pincode": 572200,
         "city": "Sanya",
         "province": "Hainan"
      },
   ]
}

该方法将所有相关数据保存在单个文档中,这使得检索和维护更容易。可以使用单个查询来在整个文档检索,例如 -

> db.users.findOne({"name":"Maxsu"},{"address":1, "name":1})

请注意,在上述查询中,dbusers分别是数据库和集合。缺点是如果嵌入式文档的大小如果不断增长,可能会影响读/写性能。

5.2建模参考关系

这是设计规范化关系的方法。 在这种方法中,用户和地址文件将分别维护,但用户文档将包含一个将引用地址文档的id字段的字段。

{
   "_id":ObjectId("52ffc33321332111sdfaf"),
   "contact": "13800138000",
   "dob": "1991-11-11",
   "name": "Maxsu",
   "address_ids": [
      ObjectId("123123"),
      ObjectId("123412")
   ]
}

如上所示,用户文档包含对应地址的ObjectId的数组字段address_ids。 使用这些ObjectIds,我们可以从那里查询地址文件并获取地址详细信息。 使用这种方法,需要两个查询:首先从用户文档获取address_ids字段,然后从地址集中获取这些地址。

>var result = db.users.findOne({"name":"Maxsu"},{"address_ids":1})
>var addresses = db.address.find({"_id":{"$in":result["address_ids"]}})

6.MongoDB-update多层嵌套数组解决办法

{ "_id" : 1
  "user_id": 1,
  "message" : "Yes"
  "translations" : [
    { 
      "destination" : "fr",
      "text": "Oui"
    },
    { 
      "destination" : "bf",
      "text": "uid"
    },
  ]
}

如果是一层数组,可以用如下语句更新数组里指定key的value

db.getCollection('message').update({
    '_id': 1,
    'translations.destination': 'fr'   
},
{
    '$set': {
        "translations.$.text": "asd"
    }
}

如果再加一层嵌套

{ "_id" : 1
  "user_id": 1,
  "message" : "Yes"
  "translations" : [
    { 
      "destination" : "fr",
      "text": "Oui",
      "rating" : [
        { "user_id" : 1,
          "rating" : 1
        },
        { "user_id" : 2,
          "rating" : 1
        }
      ]
    }
  ]
}

使用这个更新语句就会报错了

db.getCollection('message').update({
    '_id': 1,
    'translations.destination': 'fr',
    'translations.rating.user_id':'1'
},
{
    '$set': {
        "translations.$.rating.$.rating": 5
    }
}

目前mongodb不支持多个$占位符,推荐的方法的修改数据结构,把数据格式改成这样,把数组元素改成key-value形式

{ "_id" : 1
  "user_id": 1,
  "message" : "Yes"
  "translations" : {
    "fr": { 
      "destination" : "fr",
      "text": "Oui",
      "rating" : [
        { "user_id" : 1,
          "rating" : 1
        },
        { "user_id" : 2,
          "rating" : 1
        }
      }
    },
    "en": {...}
  ]
}

执行如下更新语句

db.getCollection('message').update({
    '_id': 1,
    'translations.destination': 'fr',
    'translations.rating.user_id':'1'
},
{
    '$set': {
       translations.fr.rating.$.rating”: 5
    }
}

ps:只能使用一个$占位符的问题在社区里已经提了很久了,一直没有得到解决,希望下个版本可以解决。

补充:MongoDB与Python的交互

1.安装

pip3 install pymongo

2.使用

演示代码:

import pymongo
from pymongo import  MongoClient
from bson.objectid import ObjectId

#1.建立连接
#创建MongoClient的对象
#方式一
#特点:可以连接默认的主机和端口号
#client = MongoClient()
#方式二
#明确指明主机和端口号
#client = MongoClient('localhost',27017)
#client = MongoClient(host='localhost',port=27017)
#方式三
#使用MongoDB URI的
client = MongoClient('mongodb://localhost:27017')

#2.获取数据库
#MongoDB的一个实例可以支持多个独立的数据库
#可以通过MongoClient的对象的属性来访问数据库
#方式一
db = client.test
print(db)
#方式二
#db = client['test']

#3.获取集合
#集合是存储在MongoDb中的一组文档,可以类似于MySQl中的表
#方式一
collection = db.stuents
#方式二
#collection = db['students']
"""
注意:
MongoDB中关于数据库和集合的创建都是懒创建
以上的操作在MongoDB的服务端没有做任何操作
当第一个文档被插入集合的时候才会创建数据库和集合
"""

#4.文档
#在pymongo中使用字典来表示文档
student1 = {
    'id':'20180101',
    'name':'jack',
    'age':20,
    'gender':'male'
}

#5.插入文档
#5.1insert()
#插入单条数据
#注意:MongoDb会自动生成一个ObjectId,insert函数的返回值为objectid
result = collection.insert(student1)
print(result)

#插入多条数据
student2 = {
    'id':'20180530',
    'name':'tom',
    'age':30,
    'gender':'male'
}
student3 = {
    'id':'20180101',
    'name':'bob',
    'age':18,
    'gender':'male'
}
#result = collection.insert([student2,student3])

#5.2insert_one()
student4 = {
    'id':'20180101',
    'name':'rose',
    'age':25,
    'gender':'female'
}
#result = collection.insert_one(student4)
#print(result)           #InsertOneResult
#print(result.inserted_id)

#5.3insert_many()
#result = collection.insert_many([student2,student3]);
#print(result)           #InsertOneResult
#print(result.inserted_ids)

#6.查询文档
#6.1
#find_one()
result = collection.find_one({'name':'jack'})
print(type(result))    #<class 'dict'>
print(result)

#6.2通过objectid查询
#5b3ed21f2e1016e9ad2dc7b7
#注意:导入模块
result = collection.find_one({'_id':ObjectId('5b3ed21f2e1016e9ad2dc7b7')})
print(result)
#查询不到结果则返回None

#6.3find()
#需求:查询年龄为20的数据
results = collection.find({'age':20})
print(results)
#Cursor相当于是一个生成器,只能通过遍历的方式获取其中的数据
for r in results:
    print(r)

#需求:查询年龄大于20的数据
results = collection.find({'age':{'$gt':20}})

#6.4其他用法
#a.count()
#统计所有数据的条数
count1 = collection.find().count()
#统计制定条件的数据条数
count1 = collection.find({'age':20}).count()

#b.sort()
r0 = collection.find().sort('name',pymongo.ASCENDING)

#c.limit(),skip()
r0 = collection.find().sort('name',pymongo.ASCENDING).skip(2)
r0 = collection.find().sort('name',pymongo.ASCENDING).skip(2).limit(5)
#注意事项:在数据库数量非常庞大的情况下,最好不要使用大的 的偏移量,很可能会导致内存溢出


#7.更新文档
#7.1update()
conditon = {'name':'jack'}
student = collection.find_one(conditon);
student['age'] = 30
result = collection.update(conditon,student)

#7.2update_one()
conditon = {'name':'jack'}
student = collection.find_one(conditon);
student['age'] = 30
result = collection.update_one(conditon,{'$set':student})
print(result.matched_count,result.modified_count)

#7.2update_many()
#查询年龄大于20的数据,然后讲年龄增加1
conditon = {'age':{'$gt':20}}
result = collection.update_one(conditon,{'$inc':{'age':1}})
print(result.matched_count,result.modified_count)

#8.删除文档
#8.1remove()
#将符合条件的所有的数据全部删除
result = collection.remove({'name':'rose'})

#8.2delete_one()
result = collection.delete_one({'name':'rose'})

#8.3delete_many()
result = collection.delete_many({'name':'rose'})
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,948评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,371评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,490评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,521评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,627评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,842评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,997评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,741评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,203评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,534评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,673评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,339评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,955评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,770评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,000评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,394评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,562评论 2 349

推荐阅读更多精彩内容

  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 31,912评论 2 89
  • 一、MongoDB简介 概述MongoDB是一个基于分布式文件存储的数据库,由C++语言编写。旨在为WEB应用提供...
    EndEvent阅读 1,161评论 1 4
  • 一、MongoDB简介 概述MongoDB是一个基于分布式文件存储的数据库,由C++语言编写。旨在为WEB应用提供...
    王梓懿_1fbc阅读 492评论 0 3
  • 一、MongoDB简介 概述MongoDB是一个基于分布式文件存储的数据库,由C++语言编写。旨在为WEB应用提供...
    慕杨_阅读 553评论 0 4
  • 一、MongoDB简介 概述MongoDB是一个基于分布式文件存储的数据库,由C++语言编写。旨在为WEB应用提供...
    fly5阅读 284评论 0 0