mongodb 深入学习笔记
mongodb基本知识
mongodb是介于关系型数据库与非关系型数据库之间的NoSQL,是最像关系型数据库的产品。
- mongodb支持的查询语言非常强大,几乎可实现类似关系型数据库单表的大部分功能查询,且还可创建索引。
- mongodb是面向集合的(collection oriented),模式自由(schema free)的文档型数据库。
- 文件存储格式BSON: Binary Serialized dOcument Notation.
- mongodb服务端默认端口是27107
- mongodb是一个可移植的数据库,是一系列与磁盘有关系的物理文件所组成的。
- mongodb默认的数据目录是/data/db,它负责存储所有的MongoDB的数据文件。
mondodb的每个数据库都包含一个.sn文件和一些数据文件,且这些数据文件会随着数据量的增加越来越多,如有个foo数据库,那么在这个数据库中就会有 foo.sn, foo.1,foo.2等这些文件存在。
- 可以通过“show dbs” 命令显出所有数据库的列表,“db”命令显示当前数据库对象或集合;“use XXXX”表示连接到一个指定的数据库(XXXX)。
mongodb的逻辑结构
mongodb是一种层次结构,由文档(document),集合(collection),数据库(database)组成。
- mongodb的文档相当于关系型数据库里的一行记录;
- 多个文档组合成一个集合相当于关系型数据库里的表;
- 多个集合逻辑上组织在一起,就是数据库。
- 一个mongodb实例可支持多个数据库database。
mongodb与关系型数据库对比:
MongoDB | 关系型数据库 |
---|---|
文档(document) | 行(row) |
集合(collection) | 表(table) |
数据库(database) | 数据库(database) |
mongodb内部有预分配空间的机制,保证在数据量激增的情况下磁盘压力过大的问题。
mongodb文档里的_id
- 存储在集合中的每个文档里都会有一默认生成的主键_id值,默认是ObjectID数据类型,我们也可以根据实际情况对其进行设置的,但在同个集合中_id值是必须保持唯一的
mongodb命令&操作
- 创建数据库:use DATABASE_NAME,如果数据库不存在, 刚创建数据库, 否则切换到指定数据库。
- 删除数据库, db.dropDatabase(),删除当前数据库。
- 查看所有集合,show collections,显示当前数据库中的集合。
- 删除集合, db.collection.drop(), 删除集合。
- 插入文档,insert()方法向集合中插入文档,db.COLLECTION_NAME.insert(document),。插入文档也可以用db.collect_name.save(document)命令,如果不指定_id字段,save()方法类似于insert()方法;如果有指定_id字段,则会更新该_id的数据。
- 更新文档,用update()与save(),
db.collection.update(<query>, <update>, {upsert: <boolean>, multi:<boolean>, writeConcern: <document>})
参数说明:
query : update的查询条件,类似sql update查询内where后面的。
update : update的对象和一些更新的操作符(如$,$inc...)等,也可以理解为sql update查询内set后面的
upsert : 可选,这个参数的意思是,如果不存在update的记录,是否插入objNew,true为插入,默认是false,不插入。
multi : 可选,mongodb 默认是false,只更新找到的第一条记录,如果这个参数为true,就把按条件查出来多条记录全部更新。
writeConcern :可选,抛出异常的级别。
db.collection.save(<document>, {writeConcern:<document>})
参数说明
document: 文档数据
writeConcern:可选,抛出异常的级别
- 删除文档,db.collection.remove(<query>, {justOne: <boolean>, writeConcern:<document>})
参数说明
query:可选,删除的文档的条件
justOne : (可选)如果设为 true 或1,则只删除一个文档。
writeConcern :(可选)抛出异常的级别。
- 文档查询, db.collection.find(), 可以通过pretty()使得查询出来的结果排版好看点;db.collection.findOne()只返回一条记录。
MongoDB与关系型数据库where语句对比
操作 | 格式 | 范例 | RDBMS句型 |
---|---|---|---|
等于 | {<key>:<value>} | db.col.find({"id":"wills"}).pretty() | where id="wills" |
不等于 | {<key>: {$ne:<value>}} | db.col.find({"id":{$ne:"wills"}}).pretty() | where id!="wills" |
大于 | {<key>:{$gt:<value>}} | db.col.find({"id":{$gt:"wills"}}) | where id > "wills" |
大于等于 | {<key>:{$gte:<value>}} | db.col.find({"id":{$gte:"wills"}}).pretty() | where id>="wills" |
小于 | {<key>: {$lt:<value>}} | db.col.find({"id":{$lt:"wills"}}).pretty() | where id<"wills" |
小等于 | {<key>:{$lte:<value>}} | db.col.find({"id":{$lte:"wills"}}) | where id <= "wills" |
大于且小于 | {<key>:{$lt:<value>,$gt:<value>}} | db.col.find({"id":{$lt:100,$gt:50}}) | where id>50 and id<100 |
MongoDB里的一些条件查询
- AND
db.col.find({key1:value1, key2:value2}).pretty()
- OR
db.col.find({$or: [{key1: value1}, {key2:value2} ] } ).pretty()
- AND与OR一起用
db.col.find({key1: {$gt:value}, $or: [{key2: value},{key3:value}]}).pretty()
- limit(n)
db.col.find().pretty().limit(n) 返回n条查询到的数据
- skip(n)
db.col.find().skip(n),跳过n条数据开始查询返回
- sort();
db.col.find().sort({key1:1,key2:-1}) ,1表示升序,-1表示降序
- ensureIndex() 索引,索引是特殊的数据结构,索引存储在一个易于遍历读取的数据集合中,索引是对数据库表中一列或多列的值进行排序的一种结构。
db.col.ensureIndex({KEY:1}) Key 值为你要创建的索引字段,1为指定按升序创建索引,如果你想按降序来创建索引指定为-1即可。
参数 | 类型 | 描述 |
---|---|---|
backgrounp | boolean | 建索引过程会阻塞其它数据库操作,默认值false |
unique | boolean | 建立的索引是否唯一,默认false |
name | string | 索引名字 |
dropDups | boolean | 建立唯一索引时是否删除重复记录,指定 true 创建唯一索引。默认值为 false |
sparse | boolean | 对文档中不存在的字段数据不启用索引;这个参数需要特别注意,如果设置为true的话,在索引字段中不会查询出不包含对应字段的文档.。默认值为 false. |
expireAfterSeconds | integer | 指定一个以秒为单位的数值,完成 TTL设定,设定集合的生存时间 |
v | index version | 索引版本号 |
weight | document | 索引权重值,数值在 1 到 99,999 之间,表示该索引相对于其他索引字段的得分权重 |
default_language | string | 对于文本索引,该参数决定了停用词及词干和词器的规则的列表。 默认为英语 |
language_override | string | 对于文本索引,该参数指定了包含在文档中的字段名,语言覆盖默认的language,默认值为 language |
MongoDB 聚合
MongoDB中聚合(aggregate)主要用于处理数据(统计平均值,求和等),并返回计算后的数据结果,类似sql语句中的count(*)。
db.col.aggregate(options)
参数 | 描述 | 实例 |
---|---|---|
$sum | 求和 | db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$sum : "$likes"}}}]) |
$avg | 平均值 | db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$avg : "$likes"}}}]) |
$min | 获取集合中所有文档对应值得最小值 | db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$min : "$likes"}}}]) |
$max | 获取集合中所有文档对应值得最大值 | db.col.aggregate([{$group : {_id : "$by_user", num_tutorial : {$max : "$likes"}}}]) |
$push | 在结果文档中插入值到一个数组中 | db.col.aggregate([{$group : {_id : "$by_user", url : {$push: "$url"}}}]) |
$addToSet | 在结果文档中插入值到一个数组中,但不创建副本 | db.col.aggregate([{$group : {_id : "$by_user", url : {$addToSet : "$url"}}}]) |
$first | 根据资源文档的排序获取第一个文档数据 | db.col.aggregate([{$group : {_id : "$by_user", first_url : {$first : "$url"}}}]) |
$$last | 根据资源文档的排序获取最后一个文档数据 | db.col.aggregate([{$group : {_id : "$by_user", first_url : {$last : "$url"}}}]) |
管道的概念
管道在Unix和Linux中一般用于将当前命令的输出结果作为下一个命令的参数。
MongoDB的聚合管道将MongoDB文档在一个管道处理完毕后将结果传递给下一个管道处理。管道操作是可以重复的。
表达式:处理输入文档并输出。表达式是无状态的,只能用于计算当前聚合管道的文档,不能处理其它的文档。
这里我们介绍一下聚合框架中常用的几个操作:
- $project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。
- $match:用于过滤数据,只输出符合条件的文档。$match使用MongoDB的标准查询操作。
- $limit:用来限制MongoDB聚合管道返回的文档数。
- $skip:在聚合管道中跳过指定数量的文档,并返回余下的文档。
- $unwind:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。
- $group:将集合中的文档分组,可用于统计结果。
- $sort:将输入文档排序后输出。
- $geoNear:输出接近某一地理位置的有序文档。
db.articles.aggregate( [ { $match : { score : { $gt : 70, $lte : 90 } } },{ $group: { _id: null, count: { $sum: 1 } } }] ); $match用于获取分数大于70小于或等于90记录,然后将符合条件的记录送到下一阶段$group管道操作符进行处理