1.基础了解
1.1 什么是持久化
利用永久性存储介质将数据进行保存,在特定的时间将保存的数据进行恢复的工作机制称为持久化。持久化用于防止数据意外丢失,确保数据的完整性,安全性
1.2 持久化保存的是什么
第一种:将当前数据状态进行保存,快照方式,存储数据结果,存储格式简单,关注点在数据
第二种:将数据操作过程进行保存,日志形式,存储操作过程,存储格式复杂,关注点在数据的操作过程
2. RDB持久化
2.1 save指令实现RDB持久化
save指令:手动执行一次持久化操作
配置名称 | 说明 |
---|---|
dbfilename filename | 设置本地数据库文件名,默认为dump.db |
dir path | 设置存储.rdb文件的路径 |
rdbcompression yes|no | 设置存储至本地数据库时是否压缩文件,默认yes |
rdbchecksum yes|no | 设置读写文件过程是否进行RDB格式校验,默认yes |
2.2 save配置自动执行
主要的配置命令:save second changes
second:监控时间范围
changes:监控key数量的变化值
//示范
save 900 1
save 300 10
save 60 10000
2.4 bgsave指令实现RDB持久化
当save指令处理的数据数量过大,单线程执行方式造成效率过低,则引出bgsave
bgsave指令:手动启动后台持久化操作,但不是立即执行
配置名称 | 说明 |
---|---|
stop-writes-on-bgsave-error yes|no | 后台存储过程如果出现错误现象,是否停止保存操作,默认yes |
dbfilename filename | 设置本地数据库文件名,默认为dump.db |
dir path | 设置存储.rdb文件的路径 |
rdbcompression yes|no | 设置存储至本地数据库时是否压缩文件,默认yes |
rdbchecksum yes|no | 设置读写文件过程是否进行RDB格式校验,默认yes |
2.5 RDB方案对比&优缺点
2.5.1 RDB三种方案方式比较
方式 | save指令 | bgsave指令 |
---|---|---|
读写 | 同步 | 异步 |
阻塞客户指令 | 是 | 否 |
额外内存消耗 | 否 | 是 |
启动新线程 | 否 | 是 |
2.5.2 RDB特殊启动方式
方式 | 说明 |
---|---|
debug reload | 服务器运行过程中重启 |
shutdown save | 关闭服务器时指定保存数据 |
2.5.3 RDB优缺点
优点:
- RDB是一个紧凑压缩的二进制文件,存储效率较高
- RDB内部存储的是Redis在某个时间点的数据快照,非常适合用于数据备份,全量复制等场景
- RDB的数据恢复效率比AOF快的多
- 应用:服务器中x小时执行bgsave备份,并将RDB文件拷贝到远程服务器,用于灾难恢复
缺点:
- RDB方式无论是执行命令还是利用配置,无法做到实时持久化,具有较大的可能性丢失数据
- bgsave指令每次运行要执行fork操作创建子线程,要牺牲一些性能
- Redis的众多版本中未进行RDB文件格式统一,有可能出现个版本服务之间数据格式无法兼容
3. AOF持久化
3.1 AOF概念
1AOF(append only file)
持久化:以独立日志的方式记录每次写的命令,重启时在自动重新执行AOF文件的命令达到恢复数据的目的。与RDB
相比可以简单记录数据改为记录数据的变化过程
AOF
的主要作用是解决了数据持久化的实时性,目前已经是Redis
持久化的主流方式
配置名称 | 说明 |
---|---|
appendonly yes|no | 开启AOF持久化功能,默认为no, |
appendfilename filename | 设置本地数据库文件名,默认为appendonly.aof |
dir path | 设置存储.aof文件的路径,与.rdb文件路径一致 |
appendfsync always|everysec|no | AOF写数据策略,默认everysec |
AOF三种写数据的策略
always(每次):每次写入操作均同步到AOF文件中数据零误差,性能较低,不建议使用
everysec(每秒):每秒将缓存区中的指令同步到AOF文件中,在系统突然宕机的情况下丢失一秒数据,数据准确性较高,性能较高,建议使用,也是默认配置
no(系统控制):由操作系统控制每次同步到AOF文件的周期,整个过程不可控
3.2 AOF重写机制&工作原理
3.2.1 什么是AOF重写
随着命令不断写入AOF文件,文件会越来越大,为了解决这个问题,Redis引入了AOF重写机制压缩文件体积。AOF文件重写是将Redis进程内的数据转化为写命令同步到新的AOF文件的过程。简单说就是将通一个数据的若干条命令执行结果转化为最终结果数据对应的命令进行记录
3.2.2 AOF重写的作用
- 降低磁盘占用量,提交磁盘的利用率
- 提高持久化效率,降低持久化写时间,提高IO性能
- 降低数据恢复用时,提高数据恢复效率
3.2.3 AOF重写规则
- 进程内具有时效性的数据,并且数据已过期将不再写入文件
- 非写入类的无效指令将被忽略,只保留最终数据的写入命令
如del key1、hdel key2、srem key3、[set key 111、set key 222]等
如select指令虽然不更改数据,但是更改了数据的储存位置,此类的命令同样需要记录
- 对同一数据的多条写命令合并为一条命令
如lpush list1 a、lpush list1 b、lpush list1 c 转化为lpush list1 a b c
为了防止数据过大造成客户端的缓冲区溢出,对list、set、hash、zset等类型,每条指令最多写64个元素
3.2.4 AOF重写方式
3.2.5 AOF自动重写
3.2.6 工作原理
4. RDB&AOF优缺点分析
4.1 RDB&AOF对比
持久方式 | RDB | AOF |
---|---|---|
占用存储空间 | 小(数据级:压缩) | 大(指令级:重写) |
存储速度 | 慢 | 快 |
恢复速度 | 快 | 慢 |
数据安全性 | 会丢失数据 | 依据策略决定 |
资源消耗 | 高/重量级 | 低/轻量级 |
启动优先级 | 低 | 高 |
4.2 RDB&AOF应用场景
RDB&AOF的选择之感
- 对数据非常敏感,建议使用默认的AOF持久化方案
AOF持久化策略使用severysecond,每一秒钟fsync一次。该策略Redis仍可以保持很好的处理性能,当出现问题时,最多丢失0-1秒的数据。
注意:由于AOF文件的存储体积较大,且恢复的速率较低
- 数据呈现阶段有效性,建议使用RDB持久化方案
数据可以良好的做到阶段内无数据丢失,且恢复速率较快,阶段点数据恢复通常采用RDB方案
注意:利用RDB实现紧凑的数据持久化会使Redis性能降低,慎重使用
4.3 综合对比
- RDB&AOF的选择实际上还在做一种权衡,每种都有利有弊
- 如不能承受数分钟以内的数据丢失,对业务数据敏感,选择AOF
- 如能承受数分钟以内的数据丢失,且追求大数据集的恢复速度,选择RDB
- 灾难恢复选用RDB
- 双保险策略,同时开启RDB&AOF,重启后,Redis优先使用AOF恢复数据,降低数据丢失量