MongoDB
这几天编写程序,发现如果没有理论的支持,即使时间花的再多,效率也是不高的,所以每天在编程之前都应该先给自己充一下电。这次重新看了mongoDB权威开发指南的前四章,做了下面的读书笔记。
- mongoDB 是面向文档的数据库,不是关系型数据库;
- 文档是MongoDb中数据的基本单元;
- 每一个文档都有一个特殊的键"_id",在文档所处的集合中是唯一的。可以作为文档的唯一标识符
文档
文档是MongoDB的核心概念。包括多个键和关联的值,有序地存放在一起;
{"greeting": "Hello world!"};
- 键: greeting;
- 值: hello world;
多个键值对:
{
"greeting": "hello world", //字符串
"foo": "2" //整形
}
//另外的一个键值对
{
"foo": "2",
"greeting": "hello world"
}
文档中的键/值对必须是有序的,上面两个是不同的键值对
字符串作为键的要求:
- 键不能含有
\0
空字符,这个字符用来保存键的结尾 -
.
和$
有特别的含义,也不可以 -
_
开头的键是保留的 - MongoDB 区分类型,也区分大小写,不能有重复的键
集合是多个键值对的集合
mongoDB的使用
- mongoDB在没有参数的情况下会默认数据目录为/data/db
- 默认情况下,mongoDB监听27017端口
- mongod还会启动一个基本的http服务器,监听28017端口
- 可以通过浏览器访问http://localhost:28017来获取数据库的管理信息
- shell下可以输入
ctrl+C
来停止Mongd的运行
MongoDB中存储的文档必须有一个_id值。
- 这个值可以是任意类型的,默认是
ObjectId
对象。 - 在一个集合里面,每一个文档都有一个唯一的
_id
值,来确保集合里面的每一个文档都能被唯一标识 -
ObjectID
是_id
的默认类型 - 在插入文档的时候没有
_id
,系统会自动帮你创建一个。
强大的shell操作
-
insert
添加一个文档到集合里面
db.数据库名.insert(自己定义好的一条数据)
-
find
查找数据库,返回集合里面的所有文档
db.数据库名.find()
-
findOne()
,返回数据库里面的一个文档
db.数据库名.findOne()
-
update()
更改数据库,接受至少两个参数,一个是更新的文档限定条件,一个是新的文档
db.blog.update({title:"my blog"}, post)
-
remove()
删除,没有参数会删除所有的文档,一般接受一个条件
db.blog.remove({title:"my blog"})
- 移除blog中所有opt-out为true的人
db.blog.remove({"opt-out": true});
- 删除数据是永久性的,不能撤销也不能恢复
更改器的使用
-
$inc
修改器增加pageviews
的值
//将name为1对应的文档中的pageview增加1
db.analytics.update({"name":"1"}, {"$inc": {"pageview": 1}});
注意:使用修改器不能修改_id的值。
-
$set
修改器用来指定一个键的值,如果这个键不存在,那么就创建它;
//users表中username为why的文档中的favoriteBook设置为c
db.users.update({"username": "why"}, {"$set": {"favoriteBook": "c"}});
-
$set
甚至可以修改键的数据类型,$set
还可以修改内嵌的属性
//将favoirteBook的键值设置为一个数组
db.users.update({"username": "why"},{"$set": {"favoriteBook": ["c","c++"]}});
-
$unset
可以完全删除字段
db.users.update({"username": "why"},{"$unset": {"favoriteBook": "c"}});
-
$inc
可以累计一个属性,如果不存在,那么会事先创建一个新的属性
//可以自己给它创建一个score: 50的属性
{"$inc": {"score": 50}}
//score+1
{"$inc": {"score": 1}}
//结果将变为score: 51;
$inc只能用来修改数字,如果想要改变其他类型的值,可以选择用$set
数组的操作
-
$push
给已有的数组末尾添加一个元素, - 要是没有这个数组,会自动创建一个新的数组
- 继续添加元素,只需要再次使用
$push
- 如果一个值不再数组里面,那么先用$ne来创建一个新的字段,再把它push到这个数组里面
db.user.update({"username": "{"$ne": "WHY"}"}, {$push:{"username": "WHY"}})
- 如果
$ne
行不通,可以直接使用$addToSet
,这样还可以避免重复
db.users.update({"username":"why"},
{"$addToSet": {"emails":"qq.mail"}}
);
db.users.update({"username":"why"},
{"$addToSet": {"emails":{"qq.mail","126.com"}} }
);
将数组作为队列或者是栈,可以使用
$pop
这个修改器从数组的任何一端删除元素
{$pop: {key: 1}}
从数组末尾删除一个元素{$pop: {key: -1}}
从数组头部删除$pull
会将数组中匹配的部分删除掉
db.lists.insert({"todo": {"dishes": "dishes" ,"laundry","dry cleaning"}})
db.lists.update({}, {"$pull", "{"todo":"laundry"}");
db.list.find()
{
"_id": ObjectId("XXXX"),
"todo" : {
"dishes",
"dry cleaning"
}
}
对于数组[1,1,2,1]执行pull 1 ,那么他会删掉重复的字段
- 定位符
$
//将原先author为tom的字段修改为why
db.blog.update({"comments.author": "tom"},
{"$set": {"comments.$.author": "why"}});
$
定位符之id那个匹配第一个匹配的元素。所以如果有多个评论人为tom的字段,只会修改第一个匹配的字段$upsert
db.math.remove()
db.math.upsert({"count": 25}, {"$inc": {"count": 3}}, true);
db.math.findOne() {
"id": ObjetcId(XXX);
"count": 28
}
先清空了集合,然后里面就没有文档,
再用upsert创建一个count的值为25的文档
然后将这个值加3,最后得到count为28的文档。
如果没有开启upsert的选项,{"count" : 25}不会匹配到任何的文档,就不会有修改
再次运行,由于没有{"count": 25}的选项,那么他会再次创建一个count为25的字段,
然后再次+3为28
-
$save
是保存
db.users.save();
更新多个文档
- 默认情况下,更新只能对符合匹配条件的第一个文档执行操作。
- 要是有多个文档符合条件,其余的文档就没有变化。
- 要使得匹配到的文档都得到更新,那么可以设置
update
的第四个参数为true
db.users.update({"birthday": "10/13/2016"},
{$set: {gift: {"happy birthday"}}, false, true});
如果想知道文档到底更新了多少,可以运行getLastError
命令
db.runCommand({getLastError: 1});
{
"err": null,
"updateExisting": true,
"n": 5,
"ok": true
}
- 这里的
n=5
就说明有5个文档被更新了。 -
updateExisting: true
说明是对已有的文档进行更新
getLastError
只能获取更新的信息,不能返回已经更新的文档,
我们可以通过findAndModify
获取更新好的文档,缺点是有点慢,需要等待数据库的响应
db.runCommand({
"findAndModify": "processes",
"query": {},
"sort": {},
"update": {}
})
- findAndModify: 字符串,集合的名字
- query: 查询文档,用来查询文档的条件
- sort: 排序的条件
- update: 修改器文档,对所有找到的文档执行更新
- remove:布尔类型,表示是否删除文档
- new: 布尔类型,表示返回的是更新前的文档还是更新后的文档,默认是更新前的文档。
- update和remove必须有一个,也只能有一个,如果匹配不到文档,那么则这个命令会返回一个错误
- 一次只能处理一个文档,也不能执行upsert操作,只能更新已有的文档
- 对于普通的更新来说,findAndModify速度比较慢,时间相当一次查找,一次更新和一次getLastError
查询
-
find
查询,查询返回一个集合中文档的子集,- 子集的范围是从0个文档到整个集合
- find的第一个参数决定要返回哪些文档,其形式也是一个文档,说明要查询的细节
- 空的查询文档, 会返回集合的全部内容,如果不指定查询文档。默认就是空。
/这样会返回集合c中的全部内容
db.users.find{}
- 当向查询文档中添加键值对时,就以限定了查找的条件
查找方式是:1. 整数匹配整数,2. 布尔值匹配布尔值, 3. 字符串匹配字符串。
//查询所有年龄为27岁的用户
db.users.find({"age": 27});
//查询username为joe的字段
db.users.find({"username": "joe"});
//这样是多字段查询,会返回username为joe,年龄为27的所以字段
db.users.find({"username": "joe", "age":27})
指定返回的键
- 有时不需要将文档中的所有键值对全部返回
- 可以通过
find()
或者findOne()
的第二个参数来指定想要的键 - 这样可以节省传输的数据量,也可以节省客户端解码文档的时间和内存消耗
db.users.find({}, {"username": 1, "email": 1})
- 返回找到字段中的
username
和email
- 还有一个是
_id
,这个键总是被返回,即使没有指定_id
显示也是一样 - 也可以通过第二个参数来剔除查询结果中的某个键值对
db.users.find({}, {"password": 0});`
这样返回的字段中就不会出现password
这个键值对
查询条件
-
$lt
,$lte
,$gt
,$gte
,是全部的比较操作符,分别对应<, <=,>, >=
- 可以将它们组合起来查询一个范围的值
//查询年龄是18-30岁(含)的所有用户
db.users.find({"age": {"$gte": 18, "$lte": 30}})
//可以查询在现在这个时间之前注册过的用户
start = new Date();
db.users.find({"registerDate": {"$lt": start}})
-
$ne
表示不等
//找到名字不是joe的用户
db.users.find({"username": {"$ne":"joe"}})
$ne可以用于所有类型的数据
OR查询
mongoDB有两种方式进行OR查询,$in
可以查询一个键的多个值,
$or
可以用来完成多个键值对的任意给定值(更加通用)
db.users.find({"username": {"$in":["why","joe"]}})
这回匹配username
为why
的文档,也会匹配username
为joe
的文档
如果$in中对于的数组只有一个值,那么这和直接匹配这个值得效果是一样的
{ticket_no: {$in:[125]}}和{ticket_no: 125}是一样的
与$in相反的是$nin
,将返回与数组中所有条件都不匹配的文档
db.users.find({"username": {"$nin":["why","joe"]}})
返回username既不是why,也不是joe的user
$in
只能对单个键做OR查询,而$or
可以查询包含所有可能条件的参数作为数组
db.raffie.find({"$or": [{"ticket_no": 125}, {"winner": true}]})
这样会返回ticket_no"是125,winner是true的所有字段
$or还可以含有其他条件语句
db.raffie.find({"$or": [
{"ticket_no": ["$in":[123,124,125]]},
{"winner": true}
]})
条件句的规则
在查询中,$lt
在内层文档,而更新中$inc
是外层文档的键
条件句是内层文档的键,而修改器是外层文档的键
一个键可以有多个条件,但是一个键不能对于多个更新更改器
//正确
db.users.find({"age": {"lt": 30, "$gt": 20})
//错误
db.user.find({"$inc": {"age":1}, "$set": {age:40}})
null比较特殊,不仅仅匹配自身,而且还匹配不存在,所以我们在匹配键值为null的文档的同时,还要检查该建筑是否存在
db.c.find({"z": {"$in":[null], "$exists": true}});
没有$eq
操作符,我们使用$in
操作符代替
正则表达式
匹配名为Joe或者joe的用户,可以用正则表达式匹配大小写
db.users.find({"name":/joe/i})
正则表达式还可以插入到数据库,自身也可以匹配
db.foo.insert({"bar": /baba/})
db.foo.find("bar": /baba/)
{
"_id": ObjectId("XXXXX"),
"bar": /baba/
}
查询数组
- 插入一个数组
db.food.insert({"fruit":["apple", "banana"]})
db.food.find({"fruit":"banana"})
//找得到,但是比较低效
- $all 如果需要多个元素来匹配数组,那么就需要用到$all,这样会匹配一组元素
db.find({"fruit": {$all: ["apple"]})
- $size 可以用来查询指定长度的数组
db.food.({"fruit": {"$size":3}})
- $slice
find
的第二个参数是可选的,可以返回那些键,"$slice"返回的是数组的一个子集合
//返回的是前10条评论
db.blog.posts.findOne(criteria, {"comments": {"$slice": 10}})
//-10表示的是后10条评论
db.blog.posts.findOne(criteria, {"comments": {"$slice": -10}})
//这个操作会跳过前面的前23个元素,返回第24个到第33个元素。
//如果数组不够33个元素,那么会返回第23个元素后面的全部元素
db.blog.posts.findOne(criteria, {"comments": {"$slice": [23,10]}})
- limit()限制查询的结果数量
//只返回3个结果
如果返回的结果不足3个,那么返回匹配数量的结果。limit是上限而不是下线
db.c.find().limit(3);
//skip与limit类似
db.c.find().skip(3)
- sort是用一个对象作为参数:
一组键值对,键对应文档的键名,值代表查询的方向,排序方向可以是1升序-1降序 。 如果指定了多个键,那么按照键的顺序逐个进行进行排序
db.c.find().sort({username: 1, age: -1})
简单的分页, 按照date的降序显示文档
var page1 = db.foo.find(cirterial).limit(100)
var latest = null;
while(page1.hasNext()) {
latest = page1.next();
display(latest);
}
//get next page
var page2 = db.foo.find({"date": {"$gt": latest.date}});
page2.sort({"date": -1}).limit(100);
唯一索引
db.people.ensureIndex({"username": 1}, {"unique": true});