Redis数据结构

1. 简单动态字符串(SDS)

Redis没有直接使用C语言传统的字符串表示(以空字符结尾的字符数据)，
而是自己构建了一种名为简单动态字符串(simple dynamic string, SDS)的抽象类型，并将
SDS用作Redis的默认字符串表示。

在Redis的数据库里面,包含字符串值得键值对在底层都是由SDS实现的。

1.1 SDS的定义

每个sds.h/sdshdr结构表示一个SDS值：

struct sdshdr{
    //记录buf数组中已使用字节的数量
    //等于SDS所保存字符串的长度
    int len;
    //记录buf数组中未使用字节的数量
    int free;
    //字节数组,用于保存字符串
    char buf[];
};

[图片上传失败...(image-3d459b-1534468503539)]

SDS遵循C字符串以空字符结尾的管理，保存空字符的1空间不计算在SDS的len属性里面，
并且为空字符分配而额外的1字节空间，以及添加空字符到字符串末尾等操作，都是由SDS函数自动完成的。

1.2 简单比较一下C字符串：

常数复杂度获取字符串长度
可以直接通过len属性获取SDS本身的长度，时间复杂对是O（1）。

杜绝缓冲区溢出

C字符串不记录自己长度带来的另一个问题是容易造成缓冲区溢出（buffer overflow）
当SDS API需要对SDS进行修改时，API会先检查SDS的空间爱你是否满足修改所需的要求，
如果不满足的话，API会自动将SDS的控件扩展至执行修改所需的大小，
然后才执行实际的修改操作，所以使用SDS既不需要手动修改SDS的空间大小，也不会出缓冲区溢出问题。

减少修改字符串时带来的内存重分配次数

C字符串在每次增长那个或者缩短一个C字符串，程序都总要对保存这个C字符串的数组进行一次内存重新分配。
如果频繁进行内存重分配，可能会对性能造成影响。

SDS实现了 空间预分配 和 惰性空间释放 两种优化策略。

1. 空间预分配

用于优化SDS的字符串增长操作：当SDS的API对一个SDS进行修改，并且需要对SDS即你想那个控件扩展
的时候，程序不仅会为SDS分配修改所必须要的空间，还会为SDS分配额外的未分配的未使用空间。

额外分配的未使用空间数量由以下公式决定：

如果对SDS进行修改之后，SDS的长度（业绩是len属性的值）将小于1MB，
那么程序分配和len属性同样大小的未使用空间，这时SDS len属性的值将和free属性的值
相同。
如果对SDS进行修改之后，SDS的长度将大于等于1MB，那么程序会分配1MB的未使用空间。

在扩展SDS空间之前，SDS API会先检查为食欲on个空间是否足够，如果足够的话，API就会直接使用
未使用控件，而无须执行内存重分配，所以连续增长N次字符串所需的内存重分配次数从必定
N次降低为最多N次。

2. 惰性空间释放

惰性控件释放用于优化SDS的字符串缩短操作：当SDS的API需要缩短SDS保存的字符串时，
程序并不立即使用内存重分配来回收缩短后多的字节，而是使用free属性将这些字节的数量记录起来，
并等待将来使用。

二进制安全

通过使用二进制安全的 SDS ，而不是 C 字符串，使得 Redis 不仅可以保存文本数据，还可以保存任意格式的二进制数据。

兼容部分 C 字符串函数

通过遵循 C 字符串以空字符结尾的惯例， SDS 可以在有需要时重用 <string.h> 函数库，从而避免了不必要的代码重复。

2. 链表

链表提供了高效的节点重排能力，以及顺序型的结点访问形式，并且可以通过增删节点来灵活地
调整链表的长度。

2.1 链表和链表节点的实现

每个链表节点使用一个adlist.h/listNode结构来表示：

typedef strtct listNode {
    //前置节点
    struct listNode *prev;
    //后置节点
    struct listNode *next;
    //节点的值
    void *value;
}listNode;

多个listNode可以通过prev和next指针组成双端链表，如下图

[图片上传失败...(image-c25d40-1534468503539)]

还有一个list结构adlist.h/list来持有链表，操作起来更方便：

typedef struct list {
    //表头节点
    listNode *head;
    //表尾节点
    listNode *tail;
    //链表所包含的节点数量
    unsigned long len;
    //节点值复制函数
    void *(*dup) (void *ptr);
    //节点值释放函数
    void (*free) (void *ptr);
    //节点值对比函数
    int (*match) (void *ptr, void *key);
}list;

list结构：

[图片上传失败...(image-6aa890-1534468503539)]

Redis的链表实现的特性可以总结如下:

双端：链表节点带有prev和next指针，获取某个节点的前置和后置节点的复杂度都是O（1）。
无环：表头节点的prev指针和表尾节点的next指针都指向NULL，对链表的访问以NULL为终点。
带表头指针和表尾指针：通过list结构的head指针和tail指针，程序获取链表的表头节点和表尾节点的复杂度为O（1）。
带链表长度计数器：程序使用list结构的len属性来对list持有的链表节点进行技术，程序获取链表中节点数量的复杂对为O（1）。
多态：链表节点使用void*指针来保存节点值，并且可以通过list结构的dup、free、match三个属性为节点值设置类型特定函数，所以链表可以用于保存各种不同类型的值。

3. 字典

字典，又称为符号表（symbol table）、关联数组（associativce array）或映射（map），
是一种用于保存键值对（key-value pair）的抽象数据结构。

3.1 字典的实现

Redis的字典使用哈希表作为底层实现，一个哈希表里面可以有多个哈希表节点，而每个哈希表节点就保存了字典中的一个键值对。

3.1.1 哈希表

Redis字典所使用的哈希表由dict.h/dictht结构定义:

typedef struct dictht {
    //哈希表数组
    dictEntry **table;
    //哈希表大小
    unsigned long size;
    //哈希表大小掩码，用于计算索引值
    //总是等于size-1
    unsigned long sizemask;
    //该哈希表已有节点的数量
    unsigned long used;
}dictht;

table属性是一个数组，数组中的每个元素都是一个指向dict.h/dictEntry结构的指针，每个dictEntry结构保存着一个键值对。

<center>
[图片上传失败...(image-ddd855-1534468503539)]
</center>

3.1.2 字典结构

Redis中的字典由dict.h/dict结构表示

typedef struct *type {
    //类型特定函数
    dictType *type;
    //私有数据
    void *privdata;
    //哈希表
    dictht ht[2];
    //rehash 索引
    //当rehash不在进行时，值为-1
    in trehashidx; /*rehashing not in progress if rehashidx == -1*/
}dict;

[图片上传失败...(image-926dd-1534468503539)]

3.2 哈希算法

当要将一个新的键值对添加到字典里面时，程序需要先更具键值对的键计算出哈希值和索引值，然后再根据索引值，将包含新键值对的哈希表节点放到哈希表数组的指定索引上面。

计算哈希值的方法：
hash = dict->type=>hashFunction(key);
使用哈希表的sizemask属性和哈希值，计算出索引值：
index = hash & dict->ht[x].sizemask;

3.3 解决键冲突

当有两个或以上数量的键被分配到哈希表数组的同一个索引上面时，我们称这些键发生了冲突（collision）。

Redis的哈希表使用链地址法（separate chaining）来解决键冲突，每个哈希表节点都有一个next指针，多个哈希节点可以用next指针构成一个单向链表。
被分配到同一个索引上的多个节点可以用这个单向链表链接起来，折旧解决了键冲突的问题。

程序总是将新节点添加到链表的表头位置（复杂度为O(1)），排在其它已有节点的前面。

3.4 rehash

扩展和收缩哈希表的工作可以通过rehash（重新散列）操作完成，Redis对字典的哈希表执行rehash的步骤如下：

1. 为字典的ht[1]哈希表分配空间，这个哈希表的空间大小取决于要执行的操作，以及ht[0]当前包含的键值对数量（也就是ht[0].used属性的值）

如果执行的是扩展操作，那么ht[1]的大小为第一个大于等于ht[0].used*2的2的n次方。
如果执行的是收缩操作，那么ht[1]的大小为第一个大于等于ht[0].used的2的n次方。

2. 将保存在ht[0]中的所有键值对rehash到ht[1]上面：rehash指的是重新计算键的哈希值和索引值，然后将降至对放置到ht[1]哈希表的指定位置上。

3. 当ht[0]包含的所有键值对都迁移到ht[1]之后（ht[0]变为空表），释放ht[0]，将ht[1]设置为ht[0]，并在ht[1]新创建一个空白哈希表，为下一次rehash做准备。

3.5 哈希表的扩展和收缩

先说一下哈希表的负载因子：
load_factor = ht[0].used / ht[0].size

扩展的条件：

服务器目前没有正在执行BGSAVE命令或者BGREWRITEAOF命令，哈比表的负载因子大于等于1.
服务器目前正在执行BGSAVE命令或者BGREWRITEAOF命令，哈希表的负载因子大于等于5.

收缩操作的条件：
哈希表的负载因子小于0.1.

4. 跳跃表

跳跃表（skiplist）是一种有序数据结构，它通过在每个节点中维持多个指向其它节点的指针，从而达到快速访问节点的目的。

跳跃表支持平均O（logN）、最坏O（N）复杂度的节点查找，还可以通过顺序性操作来批量处理节点。

Redis只在两个地方用到了跳跃表，一个是实现有序集合键，另一个是在集群节点中用作内部数据结构。

4.1 跳跃表的实现

Redis的跳跃表由redis.h/zskiplistNode和redis.h/zskiplist两个结构定义，其中zskipistNode结构用于表示跳跃表节点，而zskiplist结构则用于保存跳跃表节点的相关信息，比如节点的数量，以及指向及表头节点和表尾节点的指针等等。

[图片上传失败...(image-5f729f-1534468503539)]

zskiplist比较简单，用于存放zskiplistNode，属性值也比较易懂。

zskiplistNode的结构：

层（level）：节点中用L1、L2、L3等字样标记节点的各个层，每个层都带有两个属性：前进指针和跨度。
后退（backward）指针：节点中用BW字样标记节点的后腿指针，它指向位于当前节点的前一个节点。后退指针在程序从表尾向表头遍历时使用。
分值（score）：各个节点中的1.0、2.0和3.0都是节点所保存的分支。在跳跃表中，节点按各自所保存的分值从最小到大排列。
成员对象（obj）：哥哥几点中的o1、o2和o3及诶但所保存的成员对象。

4.1.1 跳跃表节点

typedef struct zskiplistNode {
    //层
    struct zskiplistLevel {
        //前进指针
        struct zskiplistNode * forward;
        //跨度
        unsigned int span;
    } level[];
    //后退指针
    struct zskiplistNode *backward;
    //分数
    double score;
    //成员对象
    robj *obj;
} zskiplistNode;

有以下属性：

层：跳跃表节点的level数字可以包含多个元素，程序可以通过这些层来加快访问其它节点的速度。
level数组大小就是ceng的“高度”。
前进指针：每个层都有一个指向表尾的前进指针（level[i].forward属性），用于从表头向表尾访问节点，可以一次跳过多个节点。
跨度：层的跨度（level[i].span属性）用于记录两个节点之间的距离，跨度实际上是用来计算排位(rank)的。
后退指针：节点的后腿指针（backward属性）用于从表尾向表头方向访问节点，每个节点只有一个后退指针，所以每次只能后退至前一个节点。
分值和成员：节点的分值（score属性）是一个double类型的浮点数，跳跃表中的所有节点都按分值从小到大排序。
节点的成员对象（obj对象）是一个指针，它指向一个字符串对象，而字符串对象则保存着一个SDS值。

4.1.2 跳跃表

通过一个zskiplist结构来持有节点，程序可以更方便地对整个跳跃表进行处理。

typedef struct zskiplist {
    //表头节点和表尾节点
    struct skiplistNode *header, *tail;
    //表中节点的数量
    unsigned long length;
    //表中层数最大的节点的层数（不包括表头节点）
    int level;
}zskiplist;

5. 整数集合

整数集合（intest）是集合键的底层实现之一，当一个集合只包含整数值元素，并且这个集合的元素数量不多时，Redis就会使用整数集合作为集合键的底层实现。

5.1 整数集合的实现

整数集合（intset）是Redis用于保存整数值的集合抽象数据结构，它可以保存类型为int16_t、int32_t、int64_t的整数值，并且保证集合中不会出现重复元素。

每个intset.h/intset结构表示一个整数集合：

typedef struct intset {
    //编码方式
    unint32_t encoding;
    //集合包含的元素数量
    unint32_t length;
    //保存元素的数组
    int8_t contents[];
}intset;

5.2 升级

当添加一个新元素添加到整数集合里面，并且新元素的类型那个比整数集合现有所有元素的类型都要长时，整数集合需要先进行升级（upgrade），然后才能将新元素添加到整数集合里面。

升级整数集合并添加新元素共分为三步进行：

根据新元素的类型，扩展整数集合底层数组的控件大小，并为新元素分配空间。
将底层数组现有的所有元素都转换成与新元素相同的类型，并将类型转换后的元素放置正确的为上，而且在放置元素的工程中，需要继续维持底层数组的有序性质不变。
将新元素添加到底层数组里面。

整数集合不支持降级操作，一旦对数组进行升级，编码就会一直保持升级后的状态。

6. 压缩列表

压缩列表（ziplist）是 列表键 和 哈希键 的底层实现之一。当一个列表键只包含少量列表项，并且每个列表项要么就是小整数值，要么就是长度比较短的字符串，那么Redis就会使用压缩列表来做列表键的底层实现。

6.1 压缩列表的构成

压缩列表是Redis为了节约内存而开发的，是由一系列特殊编码的连续内存块组成的顺序型（sequential）数据结构。

一个压缩列表可以包含任意多个节点（entry），每个节点可以保存一个字节数组或者一个整数值。

属性	类型	长度	用途
zlbytes	uint32_t	4 字节	记录整个压缩列表占用的内存字节数：在对压缩列表进行内存重分配，或者计算 zlend的位置时使用。
zltail	uint32_t	4 字节	记录压缩列表表尾节点距离压缩列表的起始地址有多少字节：通过这个偏移量，程序无须遍历整个压缩列表就可以确定表尾节点的地址。
zllen	uint16_t	2 字节	记录了压缩列表包含的节点数量：当这个属性的值小于 UINT16_MAX （65535）时，这个属性的值就是压缩列表包含节点的数量；当这个值等于 UINT16_MAX 时，节点的真实数量需要遍历整个压缩列表才能计算得出。
entryX	列表节点	不定	压缩列表包含的各个节点，节点的长度由节点保存的内容决定。
zlend	uint8_t	1 字节	特殊值 0xFF （十进制 255 ），用于标记压缩列表的末端。

6.2 压缩列表节点的构成

每个压缩列表节点（上面提到的entryX）可以保存一个字节数组或者一个整数值。
<center>
[图片上传失败...(image-47333b-1534468503539)]
</center>

previous_entry_legth的作用：
节点的previous_entry_lenght属性记录了前一个节点的长度，程序通过当前节点的起始地址计算出前一个节点的起始地址： p = c - current_entry_length;
encoding:
该属性记录了节点的content属性所保存数据的类型以及长度
content:
该属性保存节点的值，节点值可以是一个字节数组或者整数，值的类型和长度由节点的encoding属性决定。

6.3 连锁更新

如果在压缩列表中插入一个新的节点，长度超出下一节点所保存的previous_entry_length，这时就需要更新下一节点的previous_entry_length。

同样，有可能导致第二个节点的空间变大，第三个节点也需要更新保存着第二个节点的previous_entry_length，以此类推，导致连锁更新。

在删除节点的时候，也有可能导致previous_entry_length的更新，也是会引起连锁更新的。

因为连锁更新在最坏情况下需要对压缩列表执行N次空间重分配操作，而每次空间重分配的最坏复杂对为O（N），
所以连锁更新的最坏复杂度为O（N的平方）

学习参看地址

Redis数据结构