(2022.04.26 Tues)
Redis性能优异,是如下几个方面特性的结果
- 基于内存实现
- 高效数据结构
- 合理的数据编码
- 合适的线程模型
基于内存实现
数据存放在硬盘上和存放在内存中,I/O速度只差显而易见。DDR5标准内存的带宽可达32GB/s,而常见的USB3.0接口的理论最大带宽是625MB/s,最新的USB4的最大带宽为5GB/s。数据吞吐速度只差显著。
高效的数据结构
Redis中提供了如下几种数据结构,string、list、hash、set、zset。
String
String类型的实现采用动态字符串(SDS)。
在C语言中,一个字符串的结尾标志是\0
符号。遍历一个字符串,直到遇到该符号,可断定已经到达字符串结尾。复杂度O(n)
。在Redis中字符串的开头有一个字段记录字符串的长度,仅需读取该字段就可得知字符串长度。复杂度O(1)
。
Redis的字符串使用了空间预分配的策略,类似于Python中list的生成策略。即创建字符串,当长度低于某个值,如1M,为字符串申请额外的相同长度的空间用于存放字符,比如字符长度5,则除了保存字符的5个长度,还会额外申请5个空间外加1个空白位置。当长度长于1M,则额外申请1M个空间。空间预分配策略用于字符串的append等操作。SDS 缩短时,并不会回收多余的内存空间,而是使用 free 字段将多出来的空间记录下来。如果后续有变更操作,直接使用 free 中记录的空间,减少了内存的分配。
List
List采用双向链表实现。每个list除了保存list本身的元素,还会以字段形式保存list长度,list的head指针和tail指针。而list中的每个元素,除了保存自身的值,还会保存prev和next两个指针。查询和添加的复杂度都为O(1)
,获取List长度的复杂度为O(1)
。
压缩列表:如果在一个链表节点中存储一个小数据,比如一个字节。那么对应的就要保存头节点,前后指针等额外的数据。它是经过特殊编码,专门为了提升内存使用效率设计的。所有的操作都是通过指针与解码出来的偏移量进行的,并且压缩列表的内存是连续分配的,遍历的速度很快。
字典
Redis数据库采用k-v格式保存数据,通过Hash的形式实现,读取和写入的复杂度O(1)
。
合理的数据编码
String:存储数字采用int类型的编码,如果是非数字采用 raw 编码;
List:字符串长度及元素个数小于一定范围使用 ziplist 编码,任意条件不满足,则转化为 linkedlist 编码;
Hash:hash 对象保存的键值对内的键和值字符串长度小于一定值及键值对;
Set:保存元素为整数及元素个数小于一定范围使用 intset 编码,任意条件不满足,则使用 hashtable 编码;
Zset:zset 对象中保存的元素个数小于及成员长度小于一定值使用 ziplist 编码,任意条件不满足,则使用 skiplist 编码。
合适的线程模型
Redis使用单线程模型。多个用户从不同的客户端向Redis服务器发送请求,I/O多路复用程序监听多个socket,将这些请求全部推入一个队列中,之后交给单线程的文件分派器逐个执行。因此说Redis是单线程的。
分派器从Redis的数据库中查询数据因为内存访问速度极快,因此不需要通过多线程方式减少访问时间。
单线程的工作模式避免了多线程需要进行的CPU 上下文切换,这个操作比较耗时。Redis 基于内存实现的,对于内存来说没有上下文切换效率就是最高的。多次读写都在一个CPU 上,对于内存来说是最佳方案。
Reference
1 百度,Redis 为什么这么快?这才是最完美的回答,教育专家雷教授
2 知乎问题,redis为什么那么快