简介
- Redis的持久化方式之一
RDB
是通过保存数据库中的键值对来记录数据库的状态。而另一种持久化方式AOF
则是通过保存Redis服务器所执行的写命令来记录数据库状态。 - 以
日志
的形式来记录每个写操作(增量保存),将Redis执行过的所有写指令记录下来(读操作不记录), 只许追加文件但不可以改写文件
,redis启动之初会读取该文件重新构建数据,换言之,redis 重启的话就根据日志文件的内容将写指令从前到后执行一次以完成数据的恢复工作。
对比如下命令:
RDB
持久化方式就是将str1,str2,str3
这三个键值对保存到RDB
文件中,而AOF
持久化则是将执行的set,sadd,lpush
三个命令保存到AOF
文件中。
AOF持久化流程
- 客户端的请求写命令会被
append
追加到AOF
缓冲区内; -
AOF
缓冲区根据AOF持久化策略[always,everysec,no]
将操作sync同步到磁盘的AOF文件中; -
AOF
文件大小超过重写策略或手动重写时,会对AOF文件rewrite
重写,压缩AOF文件容量; - Redis服务重启时,会重新load加载
AOF
文件中的写操作达到数据恢复的目的;
AOF 配置
在 redis.conf 配置文件的 APPEND ONLY MODE 下:
-
appendonly
:默认值为no,也就是说redis默认
使用的是rdb
方式持久化,如果想要开启 AOF 持久化方式,需要将appendonly
修改为 yes。 -
appendfilename
:aof文件名,默认是appendonly.aof
。 -
appendfsync
:aof持久化策略的配置。-
no
表示不执行fsync
,由操作系统保证数据同步到磁盘,速度最快,但是不太安全。 -
always
表示每次写入都执行fsync
,以保证数据同步到磁盘,效率很低。 -
everysec
表示每秒执行一次fsync
,可能会导致丢失这1s数据。通常选择everysec
,兼顾安全性和效率。
-
-
no-appendfsync-on-rewrite
:在aof重写或者写入rdb文件的时候,会执行大量IO,此时对于everysec
和always
的aof模式来说,执行fsync会造成阻塞过长时间,no-appendfsync-on-rewrite
字段设置为默认设置为no。如果对延迟要求很高的应用,这个字段可以设置为yes,否则还是设置为no,这样对持久化特性来说这是更安全的选择。 设置为yes表示rewrite
期间对新写操作不fsync
,暂时存在内存中,等rewrite
完成后再写入,默认为no,建议yes。Linux的默认fsync策略是30秒
。可能丢失30秒数据。默认值为no。 -
auto-aof-rewrite-percentage
:默认值为100。aof自动重写配置,当目前aof文件大小超过上一次重写的aof文件大小的百分之多少进行重写,即当aof文件增长到一定大小的时候,Redis能够调用bgrewriteaof
对日志文件进行重写。当前AOF文件大小是上次日志重写得到AOF文件大小的二倍(设置为100)时,自动启动新的日志重写过程。 -
auto-aof-rewrite-min-size
:64mb。设置允许重写的最小aof文件大小,避免了达到约定百分比但尺寸仍然很小的情况还要重写。 -
aof-load-truncated
:aof文件可能在尾部是不完整的,当redis启动的时候,aof文件的数据被载入内存。重启可能发生在redis所在的主机操作系统宕机后,尤其在ext4文件系统没有加上data=ordered
选项,出现这种现象 redis宕机或者异常终止不会造成尾部不完整现象,可以选择让redis退出,或者导入尽可能多的数据。如果选择的是yes,当截断的aof
文件被导入的时候,会自动发布一个log给客户端然后load。如果是no,用户必须手动redis-check-aof
修复AOF文件才可以。默认值为 yes。
恢复
AOF
的备份机制和性能虽然和RDB
不同, 但是备份和恢复的操作同RDB一样,都是拷贝备份文件,需要恢复时再拷贝到Redis工作目录下,启动系统即加载
。
正常恢复
- 修改默认的
appendonly no
,改为yes - 将有数据的
aof
文件复制一份保存到对应目录(查看目录:config get dir
)。 - 恢复:重启redis然后重新加载。
异常恢复
- 修改默认的
appendonly no
,改为yes。 - 如遇到AOF文件损坏,通过
/usr/local/bin/redis-check-aof--fix appendonly.aof
进行恢复。 - 备份被写坏的AOF文件。
- 恢复:重启redis,然后重新加载。
重写
AOF采用文件追加
方式,文件会越来越大为避免出现此种情况,新增了重写机制
, 当AOF文件的大小超过所设定的阈值时,Redis就会启动AOF文件的内容压缩, 只保留可以恢复数据的最小指令集.可以使用命令bgrewriteaof
。
重写的机制
Redis会记录上次重写时的AOF大小,默认配置是当AOF文件大小是上次rewrite
后大小的一倍且文件大于64M
时触发。
重写虽然可以节约大量磁盘空间,减少恢复时间。但是每次重写还是有一定的负担的,因此设定Redis要满足一定条件才会进行重写。 条件如下:
-
auto-aof-rewrite-percentage
:设置重写的基准值,文件达到100%
时开始重写(文件是原来重写后文件的2倍时触发)。 -
auto-aof-rewrite-min-size
:设置重写的基准值,最小文件64MB
,达到这个值开始重写。
例如:文件达到70MB开始重写,降到50MB,下次什么时候开始重写?100MB
系统载入时或者上次重写完毕时,Redis会记录此时AOF大小,设为base_size
,如果Redis的AOF当前大小>= base_size +base_size*100% (默认)且当前大小>=64mb(默认)
的情况下,Redis会对AOF进行重写。
重写流程
-
bgrewriteaof
触发重写,判断是否当前有bgsave
或bgrewriteaof
在运行,如果有,则等待该命令结束后再继续执行。 - 主进程
fork
出子进程执行重写操作,保证主进程不会阻塞。 - 子进程遍历redis内存中数据到
临时文件
,客户端的写请求同时写入aof_buf
缓冲区和aof_rewrite_buf
重写缓冲区保证原AOF文件完整以及新AOF文件生成期间的新的数据修改动作不会丢失。 - 1).子进程写完新的AOF文件后,向主进程发信号,父进程更新统计信息。
2).主进程把aof_rewrite_buf
中的数据写入到新的AOF文件。 -
使用新的AOF文件覆盖旧的AOF文件,完成AOF重写。
AOF的优缺点
优点:
- AOF 持久化的方法提供了多种的同步频率,即使使用
默认的同步频率每秒同步一次
,Redis 最多也就丢失 1 秒的数据而已。 - AOF 文件使用 Redis 命令追加的形式来构造,因此,即使 Redis 只能向 AOF 文件写入命令的片断,使用
redis-check-aof
工具也很容易修正 AOF 文件。 - AOF 文件的格式可读性较强,这也为使用者提供了更灵活的处理方式。例如,如果我们不小心错用了
FLUSHALL
命令,在重写还没进行时,我们可以手工将最后的FLUSHALL
命令去掉,然后再使用 AOF 来恢复数据。
缺点:
- 对于具有相同数据的的 Redis,
AOF 文件通常会比 RDF 文件体积更大
。 - 虽然 AOF 提供了多种同步的频率,默认情况下,每秒同步一次的频率也具有较高的性能。但在 Redis 的负载较高时,RDB 比 AOF 具好更好的性能保证。
- RDB 使用快照的形式来持久化整个 Redis 数据,而 AOF 只是将每次执行的命令追加到 AOF 文件中,因此从理论上说,RDB 比 AOF 方式更健壮。官方文档也指出,AOF 的确也存在一些 BUG,这些 BUG 在 RDB 没有存在。
总结
用哪个好
官方推荐两个都启用,如果对数据不敏感,可以选单独用RDB。不建议单独用 AOF,因为可能会出现Bug。如果只是做纯内存缓存,可以都不用。
官方建议
-
RDB
持久化方式能够在指定的时间间隔能对你的数据进行快照存储。 -
AOF
持久化方式记录每次对服务器写的操作,当服务器重启的时候会重新执行这些命令来恢复原始的数据,AOF
命令以redis协议追加
保存每次写的操作
到文件末尾.。 - Redis还能对
AOF
文件进行后台重写,使得AOF
文件的体积不至于过大。 - 只做缓存:如果你只希望你的数据在服务器运行的时候存在,你也可以不使用任何持久化方式。
- 同时开启两种持久化方式。
- 在这种情况下,当redis重启的时候会
优先载入AOF文件来恢复原始的数据
, 因为在通常情况下AOF文件保存的数据集要比RDB文件保存的数据集要完整。
- 在这种情况下,当redis重启的时候会
- RDB的数据不实时,同时使用两者时服务器重启也只会找AOF文件。那要不要只使用AOF呢?
- 建议不要,因为RDB更适合用于备份数据库(AOF在不断变化不好备份), 快速重启,而且不会有AOF可能潜在的bug,留着作为一个万一的手段。
性能建议
因为RDB文件只用作后备用途,建议只在Slave
上持久化RDB
文件,而且只要15分钟备份一次就够了,只保留save 900 1
这条规则。
如果使用AOF
,好处是在最恶劣情况下也只会丢失不超过两秒数据,启动脚本较简单只load自己的AOF文件就可以了。代价,一是带来了持续的IO,二是AOF rewrite
的最后将rewrite
过程中产生的新数据写到新文件造成的阻塞几乎是不可避免的。只要硬盘许可,应该尽量减少AOF rewrite
的频率,AOF重写的基础大小默认值64M太小了,可以设到5G以上。默认超过原大小100%大小时重写可以改到适当的数值。