redis 阻塞简介
redis是单线程架构,所有读写操作都是在一个线程上进行的,如果某个命令造成了阻塞,哪怕是轻微的阻塞,都会造成整个应用性能的下降,我们应该理解redis阻塞的造成原因,以及防治手段,以便更好的发挥redis的高性能,提升整个应用的性能。
redis阻塞的原因分析
内在原因
- 使用命令不当,使用数据结构不合理等因素,比如hgetall命令,时间复杂度O(n),如果元素比较多,执行速度会慢,我们应该尽量避免使用时间复杂度是O(n)的命令,而应该使用时间复杂度为O(1)上午命令代替。关于各个命令的时间复杂度,可以参考这篇文章redis命令时间复杂度。另外可以通过使用慢查询,排查出那些执行命令很慢的情况,将那些时间复杂度大的尽量使用时间复杂度小的去代替,比如hgetall用hmget代替,避免使用遍历命令。关于慢查询,可以参考这篇文章redis慢查询。也可以将大对象拆分成小对象,防止一次性操作过多无用的数据,关于如何发现大对象数据,可以用命令redis-cli --bigkeys,具体可参考客户端命令。
- CPU饱和 也是造成Redis阻塞的一个内在原因,由于redis的单线程架构,使得只能使用一个CPU,当这个CPU的使用率达到100%时,就无法有效处理其他的命令了,这是会影响服务器的吞吐量和应用的的稳定性,可以使用统计命令redis-cli --stat 查看造成CPU饱和的原因
- 持久化阻塞
当redis开启了持久化功能时,也有可能存在持久化阻塞,主要原因有fork阻塞,刷盘阻塞等。
外在原因
- CPU竞争,redis是CPU密集型应用,最后不要和其他多核CPU密集型应用部署在一起,当其他进程过度消耗时,会抢占redis的CPU,造成吞吐量下降,所以部署redis应用时,要注意这点。另外,为了充分利用多核CPU的机器,一台机器通常会部署多个实例,常见的一种优化是绑定CPU,来降低CPU切换带来的开销,但是这种手段不适用于开了持久化或参与复制的主节点,应该持久化fork的子进程可能会和主进程用于同一个CPU,造成阻塞。
- 内存交换是操作系统把内存与硬盘互换的操作,由于redis的数据在内存中,速度才会快,如果发生内存交换,会严重影响性能。可以通过Redis的进程ID查询是否存在内存交换
# redis-cli -p 6383 info server|grep process_id
根据进程id查询交换信息(若进程id是4444)
cat /proc/4444/smaps|grep Swap
为了防止发生内存交换,要确保redis所在机器有足够的内存,也可设置redis最大可用内存,防止内存暴涨。
- 网络问题,当出现网络闪断,连接数溢出时,客户端会无法连接,,网络闪断指的是一般发生在网络割接和带宽耗尽的情况;redis可配置客户端的最大连接数,当客户端频繁连接,生命周期比较小的场景下,redis不会关闭无效的连接,导致redis连接数达到最大并且无法释放。这时可以设置tcp-keeplive和timeout参数,让redis主动检查和关闭无效连接。网络延迟情况也是一种因素,这种情况阻塞主要是客户端与服务端直接网络的情况,网络不好的时候会造成很大的延迟,进而造成redis阻塞。
参考书
《redis开发与运维(付磊)》