redis作为一种内存数据库,存储空间有限,为此我们需要为数据设置过期策略,只保留热点数据。如果数据不设置过期策略,内存迟早会被占用满,到时候redis写相关的操作将会被拒绝。所以redis设计考虑到这点, 就提供了过期策略供我们选择,redis内部会帮我们清理过期数据,这也是更好的为利用内存,保证缓存的都是热点数据。
redis提供了以下几种过期策略:
noeviction:数据永不逐出,如果redis使用内存达到maxmemory的限制,调用某些指令时返回错误(主要是绝大多数的写指令,DEL 和 部分其他指令不包括)
allkeys-lru:对全键进行LRU
volatile-lru:对指定了过期时间(expire set)的键进行LRU
allkeys-random:对全键进行随机逐出
volatile-random:对指定了过期时间的键随机逐出
volatile-ttl:对指定了过期时间,并且 TTL 较短的键进行逐出
redis的lru算法:
redis的lru算法是非精准的lru算法,也就是从内存驱逐的数据并一定是真正最久没有使用的。这里就涉及到一个权衡问题,如果从全部的key来搜索那些真正的需要被驱逐的key势必会增大系统开销,而redis又是单线程的,同一时刻redis服务端只能服务一个客户端,所以耗时的操作要尽量避免。所以redis是基于采样算法来选择数据驱逐,就是从要被驱逐的key选取指定个数的key,然后根据策略来淘汰,采样key的数量可以通过maxmemory-samples来配置,默认是5。增大maxmemory-samples会提高精确度,但同时也会加大cpu的开销。redis作者是测试maxmemory-samples等于10的时候已经非常接近全量的lru精确度了。
驱逐数据的内部实现:
1.passive way
redis在实现get,mget,lrange,hget等涉及到读操作的命令时,会去判断数据是否过期,过期了就会主动删除。如果开启了aof持久化策略,会将过期的key以del key的命令记录下来,在集群模式中,还会把删除过期key的这个操作以del key的标准格式告诉这些slave删除各自的键。slave并不需要主动去删除这些key,只需要听从master的命令来进行操作。
2.active way
时间事件:
这是redis利用事件机制,每隔一段时间来完成一些操作。比如删除过期的key,关闭超时的客户端连接。可以通过参数hz来调整事件执行的频率,默认是每秒执行10次。还有通过参数dynamic-hz yes,来动态调整hz的数量会参考hz的数量为基准进行动态调整。
使用activeExpireCycle 清除失效key:
Redis 服务器中每个数据库的 expires字典表中,从中尝试着随样REDIS_EXPIRELOOKUPS_PER_CRON(默认值为10)个设置了失效时间的主键,检查它们是否已经失效并删除掉失效的主键,如果失效的主键个数占本次抽样个数的比例超过25%,Redis会认为当前数据库中的失效主键依然多,所以它会继续进行下一轮的随机抽样和删除,直到刚才的比例低于25%才停止对当前数据库的处理,转向下一个数据库。这里我们需要注意的是activeExpireCycle 函数不会试图一次性处理Redis中的所有数据库,而是最多只处理REDIS_DBCRON_DBS_PER_CALL(默认值为16),activeExpireCycle 函数还有处理时间上的限制,不是想执行多久就执行多久,凡此种种都只有一个目的,那就是避免失效主键删除占用过多的CPU资源.