在Redis中只有两处使用到了跳跃表,一个是实现有序集合键,另一个就是在集群节点中用作内部数据结构,用来保存槽和键之间的关系。
1 跳跃表
跳跃表是一种有序数据结构,它通过在每个节点中维持多个指向多个指向其他节点的指针,从而达到快速访问的目的。
可以将上面的结构类比成树的结构,最底层是实际存储的数据,第二层可以看作是第一级索引,第三层可以看作第二级索引……通过上面的结构,查找的平均复杂度为O(logN),大部分情况下,跳跃表可以和平衡树相媲美。下图显示了查询13的过程:
数据越多,跳跃表相对于链表的查找优势就越明显。
2 Redis跳跃表的实现
Redis的跳跃表由在skiplistNode和zskiplist两个结构定义,其中skiplistNode结构用于表示跳跃表的节点,而zskiplist结构则用于保存跳跃表节点的相关信息,如节点的数量,以及指向表头节点和表尾节点的指针等。
上图展示了一个有3条数据的跳跃表,左侧部分是zskiplist结构,该结构包括如下属性:
(1) header:指向跳跃表表头节点的指针。
(2) tail:指向跳跃表表尾节点的指针。
(3) level:记录目前跳跃表内,层数最大那个节点的层数(不包括表头节点)。
(4) length:记录跳跃表的长度,即跳跃表的节点数(不包括表头节点)
仅靠多个跳跃表也可以组成一个跳跃表。
但是通过使用一个zskiplist结构来持有这些节点,程序可以更方便地对整个跳跃表进行处理,比如快速访问表头节点和表尾节点,或者快读获取跳跃表节点的数量。
zskiplistNode结构,包括以下属性:
(1) 层(level):节点中用L1、L2、L3表示节点的各个层,每个层都有两个属性:前进指针和跨度。其中跨度表示前进指针所指向节点和当前节点的距离。当程序从表头向表尾遍历时,访问会沿着层的前进指针进行。
(2) 后退(backward)指针:节点中用BW字样标记节点的后退指针,它指向位于当前节点的前一个节点,后退指针用于程序从表尾向表头遍历时使用。
(3) 分值(score):是一个double类型的浮点数,跳跃表中的节点按照节点的分值从小到大排列。同一个跳跃表中,它的节点保存的对象必须是唯一的,但是节点保存的分值却是可以相同的,对于分值相同的节点会按照成员对象在字典序的大小进行排序。
(4) 成员对象(obj):各个节点所保存的成员对象。
2.1 跳跃表节点
zskiplistNode结构定义
typedef struct zskiplistNode{
// 层
struct zskiplistLevel{
// 前进指针
struct zskiplistNode *forward;
// 跨度
unsigned int span;
} level []
// 后退指针
struct zskiplistNode *backward;
// 分值,double类型的浮点数
double score;
// 成员对象
robj *obj;
} zskiplistNode
2.1.1层
跳跃表节点的level数据可以包含多个元素,每隔元素都包含一个指向其他节点的指针,程序可以通过这些层加快访问节点的速度,一般来说,层数越多,访问节点的速度就越快。
每次创建一个新的跳跃表节点的时候,程序会根据幂次定律(power law,越大的数出现的概率越小)随机生成一个介于1到32之间的值作为level数组的大小,这个大小就是层的“高度”。
2.1.2 前进指针
每个层都有指向表尾方向的前进指针,用于从表头向表尾访问节点。下图表示程序从表头向表尾方向,遍历跳跃表所有节点的路径:
(1) 迭代程序首先访问跳跃表的第一个节点(表头),然后从第四层的前进指针移动到第二个节点。
(2) 在第二个节点时,程序沿着第二层的前进的前进指针移动到第三个节点。
(3) 在第三个节点时,程序沿着第二层的前进指针移动到第四个节点。
(4) 当程序再次沿着第四个节点的前进指针移动时,它碰到一个NULL,程序知道这时已经达到了跳跃表的表尾,于是遍历结束。
2.1.3 跨度
层的跨度用于记录两个节点之间的距离:
- 两个节点之间的跨度越大,它们相距得就越远。
- 指向NULL的所有前进指针的跨度都为0,因为它们没有连向任何节点。
跨度是用来计算排位(rank)的:在查找某个节点的过程中,将沿途访问过的所有层的跨度累加起来,得到的结果就是目标节点在跳跃表中的排位。
例如下图,在跳跃表中查找分值为3.0、成员对象为o3的节点时,沿途经历的层:查找的过程中经历了一层,层的跨度为3,所以目标节点在跳跃表中的排位是第3位。
同理,分值为2.0、成员对象是o2的节点在跳跃表中的排位为2。
2.1.4后退指针
节点后退指针用于从表尾向表头方向访问节点:跟可以一次跳过多个节点的前进指针不同,因为每个节点只有一个后退节点,所以每次只能后退至一个节点。
3 小结
(1) 跳跃表是有序集合底层实现之一。Redis中只有有序集合和集群节点两处使用到了跳跃表。
(2) Redis的跳跃表是通过zskiplist和zskiplistNode两个结构组成。
(3) 每个跳跃表节点的层高都是1到32之间的随机数。
(4) 在同一个跳跃表中,多个节点可以包含相同的分数值,但是成员对象必须是唯一的。
(5) 跳跃表中的及诶按顺序是按照分值排序的,当分值大小相同时,按照成员对象的字典序进行排序。
本文完
注:本文参考《Redis设计与实现》,如发现错误,请指正!