mongoDB基础
一、MongoDB简介
MongoDB 是一个基于分布式文件存储的数据库,提供高性能、高可用性和自动扩展的功能。MongoDB 是用C++语言编写的非关系型数据库。使用高效的二进制数据存储,文件存储格式为BSON (一种JSON 的扩展)等。MongoDB 支持各种编程语言,包括Python、Java、C++、GO、PHP等。
1.1 MongoDB特性
- 面向集合存储:数据被分组到若干集合,每个集合可以包含无限个文档,可以将集合想象成RDBMS的表,区别是集合不需要进行模式定义。
- 模式自由:集合中没有行和列的概念,每个文档可以有不同的key,key的值不要求一致的数据类型。
- 支持动态查询:mongoDB支持丰富的查询表达式,查询指令使用json形式表达式。
- 完整的索引支持:mongoDB的查询优化器会分析查询表达式,并生成一个高效的查询计划。
- 高效的数据存储:支持二进制数据及大型对象(图片、视频等)。
- 支持复制和故障恢复
- 自动分片以支持云级别的伸缩性,支持水平的数据库集群,可动态添加额外的服务器
1.2 mongo vs mysql
k-v --> document --> collection --> database)
cloumn --> row --> table --> database
一条document记录: {"country" : "China", "city": "BeiJing"}
1.创建数据库 >> use database_name; //有则切换,无则创建
2.删除数据库 >> db.dropDatabase();
3.展示所有数据库>> show dbs;
二、基本功能
2.1、查询
- db.collection.find(document) 查询数据【加pretty()方法后会自动格式化】
- db.collection.findOne(document) 只返回第一个
- 条件操作符
等于 db.collection.find({"name":"Lukes"}).pretty() where name= 'Lukes'
$lt 小于 db.collection.find({"likes":{$lt:50}}).pretty() where likes < 50
$lte 小于或等于 db.collection.find({"likes":{$lte:50}}).pretty() where likes <= 50
$gt 大于 db.collection.find({"likes":{$gt:50}}).pretty() where likes > 50
$gte 大于或等于 db.collection.find({"likes":{$gte:50}}).pretty() where likes >= 50
$ne 不等于 db.collection.find({"likes":{$ne:50}}).pretty() where likes != 50
$in 在多个值范围内
$nin 不在多个值范围内
$all 匹配数组中多个值
$regex 正则,用于模糊查询
$size 匹配数组大小
$mod 取模运算
$exists 字段是否存在
$slice 查询字段集合中的元素(比如从第几个之后,第N到第M个元素)
and条件 db.col.find({key1:value1, key2:value2}).pretty();
or:[{key1:value1}, {key2:value2}]}).pretty();//pretty指会将显示的结果优化
分页 db.collection_name.find().limit(number).skip(number); //limit指取几条数据,skip指第几页
排序 db.collection_name.find().sort({key:1}); //1指顺序,-1指倒序
2.2、增删改
- db.collection.insertOne(document) 单个文档插入到集合中
- db.collection.insertMany(document) 多个文档插入到集合中
- db.collection.insert(document) 单个或者多个文件插入到集合中
- db.collection.updateOne(document) 更新单条
- db.collection.updateMany(document) 更新多条
- db.collection.deleteOnedocument() 删除单条文档
- db.collection.deleteMany(document) 删除多条文档
- db.collection.save(document);
- db.collection.remove(query,{ justOne:boolean, writeConcern:document })
其中: query:(可选)删除的文档的条件。
justOne: (可选)如果设为 true 或1,则只删除一个文档。
writeConcern:(可选)抛出异常的级别。
注:如果是直接调用db.collection.remove() //则删除所有数据
2.3、聚合查询:类似MySQL中的count、sum、group by
三种聚合查询方法:聚合管道、map-reduce 和单一目标聚合方法。
聚合管道方法:MongoDB 的聚合框架就是将文档输入处理管道,在管道内完成对文档的操作,最终将文档转换为聚合结果。最基本的管道阶段提供过滤器,其操作类似查询和文档转换,可以修改输出文档的形式。其他管道操作提供了按特定字段对文档进行分组和排序的工具,以及用于聚合数组内容(包括文档数组)的工具。此外,在管道阶段还可以使用运算符来执行诸如计算平均值或连接字符串之类的任务。聚合管道可以在分片集合上运行。聚合管道方法的流程参见下图。
MongoDB 中的聚合操作语法
Query 设置统计查询条件,类似于 SQL 的 where,
field1 为分类字段,要求使用 _id 名表示分类字段,
field2 为包含各种统计操作符的数字型字段,如 avg、$min 等。
聚合内置了很多函数
- $project:修改输入文档的结构。可以用来重命名、增加或删除域,也可以用于创建计算结果以及嵌套文档。
- match使用MongoDB的标准查询操作。
- $limit:用来限制MongoDB聚合管道返回的文档数。
- $skip:在聚合管道中跳过指定数量的文档,并返回余下的文档。
- $group:将集合中的文档分组,可用于统计结果。
- $sort:将输入文档排序后输出。
- $geoNear:输出接近某一地理位置的有序文档。
- $unwind:将文档中的某一个数组类型字段拆分成多条,每条包含数组中的一个值。
实例一
db.getCollection('A_collection').aggregate({
$addFields:{
"name":{
$cond:[{$ne:["$alias", undefined]},"$alias","$host_name"]
}
},
{
$project:{
"name":1
}
}
}) //collection的alias字段是否存在,如果存在,就取alias,否则取host_name字段
实例二
{ "_id" : 1, "item" : "abc1", qty: 300 }
{ "_id" : 2, "item" : "abc2", qty: 200 }
{ "_id" : 3, "item" : "xyz1", qty: 250 }
//根据qty的值来生成新的数据(值)
db.inventory.aggregate([
{$project:
{ item: 1,
discount: {$cond: { if: { $gte: [ "$qty", 250 ] }, then: 30, else: 20 }}
}
}])
//output discount是新的键,它根据cond的if判断后,分别被赋上了相应的值
{ "_id" : 1, "item" : "abc1", "discount" : 30 }
{ "_id" : 2, "item" : "abc2", "discount" : 20 }
{ "_id" : 3, "item" : "xyz1", "discount" : 30 }
三、mongo用户
1、mongo授权启动
- 数据库用户角色:read、readWrite;
- 数据库管理角色:dbAdmin、dbOwner、userAdmin; (拥有创建数据库, 和创建用户的权力)
- 集群管理角色:clusterAdmin、clusterManager、clusterMonitor、hostManager;(管理员组, 针对整个系统进行管理)
- 备份恢复角色:backup、restore;
- 所有数据库角色:readAnyDatabase、readWriteAnyDatabase、userAdminAnyDatabase、dbAdminAnyDatabase
- 超级用户角色:root //这里还有几个角色间接或直接提供了系统超级用户的访问(dbOwner 、userAdmin、userAdminAnyDatabase)
- 内部角色:__system
- 无权限启动 >> mongod -f ***.conf
- 授权启动 >> mongod -f ***.conf -auth
- 以授权模式启动后,连接mongo时,需要带上用户名和密码
2、创建用户
db.createUser({
user:<name_string>, # 字符串 用户名
pwd:<password_string>, # 字符串 密码
roles:[{role:<role_name>,db:<db_name>}] # 数组+对象 指定用户的角色
}
)
3、删除用户
db.dropUser(<user_name>) 删除某个用户,接受字符串参数
db.dropAllUser() 删除当前库的所有用户
四、BSON
MongoDB中的JSON文档存储在名为BSON(二进制编码的JSON)的二进制表示中。
与其他将JSON数据存储为简单字符串和数字的数据库不同,BSON编码扩展了JSON表示,
使其包含额外的类型,如int、long、date、浮点数和decimal128。这使得应用程序更容易可靠地处理、排序和比较数据。
连接MongoDB的Go驱动程序中有两大类型表示BSON数据:D和Raw。
类型D家族被用来简洁地构建使用本地Go类型的BSON对象。这对于构造传递给MongoDB的命令特别有用。D家族包括四类:
- D:一个BSON文档。这种类型应该在顺序重要的情况下使用,比如MongoDB命令。
- M:一张无序的map。它和D是一样的,只是它不保持顺序。
- A:一个BSON数组。
- E:D里面的一个元素。
GridFS
- GridFS是MongoDB的一个子模块,主要用于在MongoDB中存储文件,相当于MongoDB内置的一个分布式文件系统。
- 本质上还是讲文件的数据分块存储在集合中,默认的文件集合分为fs.files和fs.chunks。
- fs.files是存储文件的基本信息,比如文件名,大小,上传时间,md5等。
- fs.chunks是存储文件真正数据的地方,一个文件会被分割成多个chunk块进行存储,一般为256k/个。
如果你的项目中用到了MongoDB,那么你可以使用GridFS来构建一个文件系统,这样就不用去购买第三方的存储服务了。
GridFS的好处是你不用单独去搭建一个文件系统,直接使用Mongodb自带的即可,备份,分片都依赖MongoDB,维护起来也方便。