过期时间设置
在Redis中提供了Expire命令设置一个键的过期时间,到期以后Redis会自动删除它。这个在我们实际使用过程中用得非常多。
redis 过期删除的原理
消极方法:在主键访问时如果发现它已经失效,那么就删除它
积极方法:周期性地从设置了失效时间的主键中选择一部分失效的主键删除。
redis 发布订阅
发布/订阅模式包含两种角色,分别是发布者和订阅者。
订阅者可以订阅一个或多个频道,而发布者可以向指定的频道发送消息,所有订阅此频道的订阅者都会受到该消息。
redis 的数据是如何持久化的?
RDB根据指定的规则定时将内存中的数据存储在硬盘上。
AOF在每次执行命令后将命令本身记录下来。
可以单独/结合使用。
RDB
当符合一定条件,redis 会单独创建 fork 一个子进程来进行持久化,会先将数据写入一个临时文件 dump.rdb,等到持久化过程都结束了,
再用这个临时文件替换上次持久化好的文件。整个过程中,主进程是不进行任何IO操作的。这就确保了极高的性能。
如果需要进行大规模的数据的恢复,且对于数据恢复的完整性不是非常敏感,那RDB方式要比AOF方式更加的高效。
RDB唯一的缺点是最后一次持久化后的数据可能丢失。
fork的作用是复制一个与当前线程一样的进程。新进程的所有数据(变量、环境变量、程序计数器)数值都和原进程一致,
但是是一个全新的进程,并作为原进程的子进程。
符合条件
- 配置规则
save seconds changes - save :当执行save命令时,Redis同步做快照操作,在快照执行过程中会阻塞所有来自客户端的请求。
当redis内存中的数据较多时,通过该命令将导致Redis较长时间的不响应。所以不建议在生产环境上使用这个命令,而是推荐使用bgsave命令 - bgsave :bgsave 命令可以在后台异步地进行快照操作。快照的同时服务器还可以继续响应来自客户端的请求。
执行BGSAVE后,Redis会立即返回ok表示开始执行快照操作。
当redis 内存中的数据较多时,通过该命令导致喏、较长时间的
- save :当执行save命令时,Redis同步做快照操作,在快照执行过程中会阻塞所有来自客户端的请求。
- flushall 清空
- 执行复制操作
AOF 方式 append-only-file
当使用redis 存储非临时数据时,一般需要打开AOF持久化来降低进程终止导致的数据丢失。
AOF可以将redis执行的每一条命令追加到硬盘文件中。这一过程会降低redis 的性能。
但大部分情况下这个影响是能够接受的。另外使用较快的硬盘可以调AOF性能。
- auto-aof-rewrite-perecntage 100 当前写入日志文件的大小超过上一次rewrite之后的文件大小的百分之100时就是2倍时触发rewrite。
- auto-aof-rewrite-min-size 64mb 最小重写大小
redis 内存回收策略 maxmemory-policy
redis提供了多种内存回收策略,当内存容量不足时,为了保证程序的运行,不得不淘汰内存中的一些对象,释放这些对象占用空间。
淘汰对象选择? 已设置过期时间的数据集(server.db[i].expires)
- 默认的策略是 noeviction。当内存使用达到阈值时,所以引起申请内存的命令都会报错。
- allkeys-lur:从数据集中挑选最近最少使用的数据淘汰。 应用对缓存的访问都是相对热点数据。
- volatile-random:从已设置时间的数据集中任意选择数据淘汰。
- volatile-lur:从已设置时间的数据集中选择最近最少数据淘汰。
- volatile-ttl:从已设置时间的数据集中挑选将要过期的数据淘汰。
redis 是单进程单线程 来处理来自所有客户端的并发请求。
cpu 并不是redis的瓶颈所在,redis的瓶颈主要机器的内存和带宽。
redis能处理高并发请求,是多路复用的并发IO(一个计算单元来处理来自多个客户端的请求)
多路复用
redis是跑在单线程的,所有操作都是按照顺序线性执行的,但是由于读写操作等待用户输入或者输出都是阻塞的,所以IO操作在一般情况下往往不能直接返回,
这会导致某一文件的IO阻塞导致整个进程无法对其他客户提供服务,而IO多路复用就是为了这个问题出现的。
- 同步阻塞
- 同步非阻塞 socket被设置为NONBLOCK
- IO多路复用:reactor设计模式,异步阻塞IO。java中的selector和linux中的epol都是这种模型
- 异步IO:经典的proactor设计迷失,也称为异步非阻塞IO
在reids中使用 LUA 脚本
原子性问题:
redis虽然是单一线程的,但是仍然会存在线程安全问题。不是来自于redis的服务器内部。
而是redis作为数据服务器,是提供给多个客户端使用的。多个客户端的操作就相当于同一个进程下的多个线程。
如果多个客户端之间没有做好数据的同步策略,就会产生数据不一致的情况。
效率
基于内存的数据库
LUA 脚本
- 减少网络开销,在lua脚本中可以把多个命令放在同一个脚本中运行
- 原子操作:redis回想整个脚本作为一个命令执行,中间不会被其他命令插入。脚本执行过程中无需担心会出现竞态条件。
- 复用性:客户端发送的脚本会永远存储在redis中。复用。
local key = "ratelimit:"..KEYS[1]
local limit = tonumber(ARGV[1])
local expireTime = ARGV[2]
local times = redis.call('incr',key)
if times == 1 then
redis.call('expire',key,expireTime)
end
if times > limit then
return 0
end
return 1
evalsha命令
- script load "return redis.call('set','lua','00')" 将脚本加入缓存。并未执行命令
- 执行evalsha命令 evalsha "id"