一、概念
在使用Redis的时候,有可能因为服务器等一些原因导致Redis宕机,那么这个时候就会丢失数据,那么要怎么做才能避免这种情况发生呢?其实Redis给我们提供了持久化机制来解决这个问题,即将缓存中的数据保存在本地,这样即使Redis宕机了也不会丢失数据。当然根据我们选择持久化机制的不同可以使得我们保存不同完整程度的数据,也可以保存绝对完整的数据,而这一切都是以牺牲Redis性能为代价的。
二、两种持久化的方式
1. RDB方式(Redis默认以此种方式进行持久化)
此种方式是将数据写入一个临时文件(以二进制的方式进行存储),持久化结束后,用这个临时文件替代上一次生成的临时文件,达到在必要时候进行数据恢复的目的(Redis在启动时会自动读取临时文件来恢复数据)。我们可以在Redis的配置文件中进行配置。在Linux系统上,Redis的配置文件名为redis.conf,在Windows系统上的配置文件名为redis.windows.conf。请看配置设置:
dir filepath:备份文件保存的路径,如dir ./表示备份文件保存在当前路径下。
dbfilename filename:表示备份文件名,如dbfilename:dump.rdb表示备份文件名为dump.rdb。
save second keychanged:表示持久化的触发机制。如save 900 1:表示在900秒内至少有一个key被改变那么就进行数据备份。这个配置可以写多行,Redis默认会有三行:
save 900 1
save 300 10
save 60 10000
2. AOF方式
AOF是将执行过的指令记录下来,数据恢复时按照从前到后的顺序再将指令执行一遍,实现数据恢复。此种方式只会将写操作的数据进行备份,因为备份读操作的数据在持久化中并没有任何意义。Redis中是默认关闭此种持久化方式的,我们可以在配置文件中进行开启,请看配置设置:
appendonly yes/no:表示将AOF持久化方式开启或关闭。
appendfilename "filename":表示备份文件名称,如appendfilename "appendonly.aof"表示备份文件名称为appendonly.aof。
appendfsync always/everysec/no:表示备份的策略,always表示一有写操作即备份,将操作命令添加到备份文件中;everysec表示每秒进行备份;no表示不自动同步。
在此必须说明,fsync是一个命令,在大多数的Linux系统下,每30s就会执行一次fsync,将数据持久化到磁盘,所以这里的appendfsync no其实是交给linux服务器,30s就持久化一次数据;另外,appendfsync everysec 每秒就持久化一次数据,如果数据量在这1s里面非常大呢,redis是持久化不过来的,那么redis就采取的是延迟持久化,会在2s后继续持久化未持久化完成的数据,在appendfsync everysec 每秒持久化的情况下,会造成写阻塞,所以会导致redis存储的数据丢失,这时候就必须采用分布式,让多台redis服务去处理。(由此可以看见,redis存储虽然很强大,但也不是完美无缺的)
存储过程:将快照内容以命令的形式追加到AOF文件中,所以随着追加AOF文件会越来越大
针对AOF文件越来越大的问题,可以对AOF文件进行重写,即将多个命令合并,如先后执行了三个命令set k1 a、set k1 b、set k1 c,那么重写后将合并了set k1 c,在Linux中命令如下:
redis-cli -h ip -p port bgrewriteaof ./redis-cli -h 127.0.0.1 -p 6379 bgrewriteaof
重写命令的操作过程:在当前的快照保存工作结束后,开启一个子进程,将AOF文件进行重写,合并set命令等操作到一个临时文件,达到缩小文件大小的目的。重写结束后后将临时文件替换为新的AOF文件(重写过程中如果有新的redis操作命令,会提交到缓存中,重写结束后追加到AOF文件内)
说明:redis2.4以上版本,重写机制自动触发。触发的相关redis.conf配置如下:
auto-aof-rewrite-percentage 100(当目前的AOF文件大小超过上一次重写文件大小的百分之几时进行重写,如果没有重启过,则以启动时的AOF文件大小为依据);
auto-aof-rewrite-min-size 64mb(允许重写的最小AOF文件大小);
数据恢复:
重启redis服务,前提是配置文件必须设置了appendonly yes,然后会从appendfile的文件加载文件。反之是从RDB中加载数据的。
三、两种持久化方式的优劣对比
1. RDB优势
1). 一旦采用该方式,那么你的整个Redis数据库将只包含一个文件,这对于文件备份而言是非常完美的。比如,你可能打算每个小时归档一次最近24小时的数据,同时还要每天归档一次最近30天的数据。通过这样的备份策略,一旦系统出现灾难性故障,我们可以非常容易的进行恢复。
2). 对于灾难恢复而言,RDB是非常不错的选择。因为我们可以非常轻松的将一个单独的文件压缩后再转移到其它存储介质上。
3). 性能最大化。对于Redis的服务进程而言,在开始持久化时,它唯一需要做的只是fork出子进程,之后再由子进程完成这些持久化的工作,这样就可以极大的避免服务进程执行IO操作了。
4). 相比于AOF机制,如果数据集很大,RDB的启动效率会更高。
2. RDB劣势
1). 如果你想保证数据的高可用性,即最大限度的避免数据丢失,那么RDB将不是一个很好的选择。因为系统一旦在定时持久化之前出现宕机现象,此前没有来得及写入磁盘的数据都将丢失。
2). 由于RDB是通过fork子进程来协助完成数据持久化工作的,因此,如果当数据集较大时,可能会导致整个服务器停止服务几百毫秒,甚至是1秒钟。
3. AOF优势
1). 该机制可以带来更高的数据安全性,即数据持久性。Redis中提供了3中同步策略,即每秒同步、每修改同步和不同步。事实上,每秒同步也是异步完成的,其效率也是非常高的,所差的是一旦系统出现宕机现象,那么这一秒钟之内修改的数据将会丢失。而每修改同步,我们可以将其视为同步持久化,即每次发生的数据变化都会被立即记录到磁盘中。可以预见,这种方式在效率上是最低的。至于无同步,无需多言,我想大家都能正确的理解它。
2). 由于该机制对日志文件的写入操作采用的是append模式,因此在写入过程中即使出现宕机现象,也不会破坏日志文件中已经存在的内容。然而如果我们本次操作只是写入了一半数据就出现了系统崩溃问题,不用担心,在Redis下一次启动之前,我们可以通过redis-check-aof工具来帮助我们解决数据一致性的问题。
3). 如果日志过大,Redis可以自动启用rewrite机制。即Redis以append模式不断的将修改数据写入到老的磁盘文件中,同时Redis还会创建一个新的文件用于记录此期间有哪些修改命令被执行。因此在进行rewrite切换时可以更好的保证数据安全性。
4). AOF包含一个格式清晰、易于理解的日志文件用于记录所有的修改操作。事实上,我们也可以通过该文件完成数据的重建。
4. AOF劣势
1). 对于相同数量的数据集而言,AOF文件通常要大于RDB文件。
2). 根据同步策略的不同,AOF在运行效率上往往会慢于RDB。总之,每秒同步策略的效率是比较高的,同步禁用策略的效率和RDB一样高效。
总结:Redis的持久化使得我们可以在一定程度上避免数据的丢失,并且持久化做得越是细致那么将会更加消耗服务器的性能,这样就与我们使用Redis数据库的来提高处理性能的初衷相违背。如果条件允许,我们可以使用Redis多服务器主从复制的方式来保证在特殊情况下数据的完整性。
学习自:https://www.jb51.net/article/65264.htm
https://blog.csdn.net/weixin_42683679/article/details/81092985
20190-08-25