思维导图
首先来看一下我们的思维导图
Mongo学习.png
MongoDB备份与恢复分两种实现方式. mongoexport 和 mongodump
mongexport
这个就是数据的导入导出, 在MONGO学习之旅(八、数据导入 导出)中已经对这种方式做了总结. 他主要针对单个数据库做全量备份. 这种方式实现起来简单、快捷。
mongodump
mongodump 工具是MongoDB提供的用来导出数据的工具,具体的用法可以参考官方文档:https://docs.mongodb.com/manual/reference/program/mongodump/
其基本语法格式如下:
mongodump -h host -p port -d dbname -o dbdirectory
- -h:mongoDB所在服务器的地址,例如:localhost, 127.0.0.1等,当然也可以指定端口号,如果指定端口号,后面的-p可以不用写。
- -p:mongoDB所暴露的端口,默认27017。
- -d:需要备份的数据库名称。例如:orderdb
- -o:备份文件存储的位置,例如:/home/mongodb/backup/这个目录需要提前建立, 系统在备份完成之后,会自动在该目录下建立一个databaseName(数据库名称)的目录。
其他更多的指定可以通过:
mongodump --help
命令来了解。
mongoDB数据恢复
mongoDB使用mongorestore命令来恢复数据库。
其语法格式如下:
mongorestore -h <host><:port> -d dbname <path>
- -h<host><:port>:mongodb所在服务器的地址。当然也可以分开写。
- -d:需要恢复的数据库名称,例如orderdb
- --drop:恢复的时候,先删除当前数据,慎用。
- <path>:mongorestore最后一个参数,设置备份数据所在的位置,例如 /home/mongodb/backup/orderdb.json
- --dir:指定备份的目录,不能和<path>同时使用。
其他更过的命令可以通过
mongorestore --help
来获取。
增量备份与恢复
上面说的都是全量备份。如果数据量大的话,全量备份是非常耗资源的,如果正巧当时处于用户访问的高峰期,全量备份会占用大量的IO资源,导致服务器不可用,这就非常影响用户体验。
增量备份一般有两种实现方式,
- 使用mongdump --oplog 属性
- 使用第三方提供的mongobackup程序
增量备份导出的是某一段时间间隔的数据,例如
image.png
值得注意的是,oplog为replica set或者master/slave模式专用(standalone模式运行mongodb并不推荐)。
oplog选项只对全库导出有效, 所以不能指定-d选项
mongodump --oplog 例子
以下例子参考使用oplog完成MongoDB增量备份
- 获取全量导入时的最新时间戳
[tim@vm backup]$ bsondump bkm/oplog.bson
{"ts":{"$timestamp":{"t":1557155068,"i":1}},"t":{"$numberLong":"1"},"h":{"$numberLong":"-8619141524121903478"},"v":2,"op":"n","ns":"","wall":{"$date":"2019-05-06T15:04:28.087Z"},"o":{"msg":"periodic noop"}}
得到时间戳Timestamp(1557155068, 1)
- 再在主库中插入数据
tenmao_mongo:PRIMARY> db.article.insert({title:"four"})
WriteResult({ "nInserted" : 1 })
- 导出新的oplog(增量)
mongodump --host localhost --port 27017 -d local -c oplog.rs -q '{ts:{$gt: Timestamp(1557155068, 1)}}'
- 导入oplog(增量)
mongorestore --host localhost --port 28017 --oplogReplay dump/local/oplog.rs.bson
- 查看备库数据
> db.article.find()
{ "_id" : ObjectId("5cd049460dec5d0273a0e3f9"), "title" : "one" }
{ "_id" : ObjectId("5cd049490dec5d0273a0e3fa"), "title" : "two" }
{ "_id" : ObjectId("5cd0494d0dec5d0273a0e3fb"), "title" : "three" }
{ "_id" : ObjectId("5cd18baedbafdcd937baa41c"), "title" : "four" }
- 继续
循环:后面就继续不断地根据前面一次的最新的timestamp,然后检索出新的oplog,再应用到备库。
mongobackup例子
以下例子参考mongodb增量备份方法
- 下载mongobackup文件包
将mongobackup的文件下载到mongodb的bin目录下
输入
chmod a+x mongobackup //让系统编译它
重启mongodb
普通备份
mongobackup --backup
- 流式备份
mongobackup --backup --stream
- 指定开始时间
mongobackup --backup -s 1385367056,1
- 增量恢复
必须指定起止时间点, 配合全备,可以恢复到任意时间点(结束时间),开始时间可以理解为全部备份的时间点。
mongobackup --recovery -s 1385367098,27350 -t 1385367132,35490 ./backup/
mongbackup 本人没有实践过, 这里只是看到网友们都在用,记录一下