【1:是什么】
在指定的时间间隔内将内存中的数据集快照写入磁盘,也就是行话讲的Snapshot快照,它恢复时是将快照文件直接读到内存里,快照文件默认为.rdb文件。
Redis会单独创建(fork)一个子进程来进行持久化,会先将数据写入到一个临时文件中,待持久化过程都结束了,再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的,这就确保了极高的性能如果需要进行大规模数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。RDB的缺点是最后一次持久化后的数据可能丢失。
注:(fork)
Fork的作用是复制一个与当前进程一样的进程。新进程的所有数据(变量、环境变量、程序计数器等)数值都和原进程一致,但是是一个全新的进程,并作为原进程的子进程
【2 :rdb文件保存位置(dump.rdb)】
默认在redis的src目录下
【3 :配置位置】
redis.conf文件中配置
【4 :触发快照】怎样才会生成或出现rdb文件
当执行shutdown,save,bgsave命令或者满足持久化频率规则都会产生rdb文件,执行save命令会立刻保存当下数据到rdb文件中,冷备份即将rdb文件copy一份留备份,常见是用shell脚本来实现,多存到不同的机器,以防机器物理损坏无法恢复数据
【5 : 如何恢复】
1:将备份的dump.rdb文件移动到redis的安装目录并启动服务
2:CONFIG GET dir获取目录
【6 :优势】
1 : 适合大规模的数据恢复
2 : 对数据完整性和一致性要求不高
【7 :劣势】
1:在一定间隔时间做一次备份,所以如果redis意外down掉的话,就会丢失最 后一次快照后的所有修改
2 :Fork的时候,内存中的数据被克隆了一份,大致2倍的膨胀性需要考虑
【8 : 停止】
动态停止所有RDB保存规则的方法:redis-cli config set save ""
【9 :总结】
【10 :Which one】
附加:性能建议2
因为RDB文件只用作后备用途,建议只在Slave上持久化RDB文件,而且只要15分钟备份一次就够了,只保留save 900 1这条规则。
如果Enalbe AOF,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只load自己的AOF文件就可以了。代价一是带来了持续的IO,二是AOF rewrite的最后将rewrite过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite的频率,AOF重写的基础大小默认值64M太小了,可以设到5G以上。默认超过原大小100%大小时重写可以改到适当的数值。
如果不Enable AOF ,仅靠Master-Slave Replication 实现高可用性也可以。能省掉一大笔IO也减少了rewrite时带来的系统波动。代价是如果Master/Slave同时倒掉,会丢失十几分钟的数据,启动脚本也要比较两个Master/Slave中的RDB文件,载入较新的那个。新浪微博就选用了这种架构