记录阅读这本书时觉得有用的东西,也许很零散。(第一部分)
字符串
redis的字符串底层实现为简单动态字符串simple-dynamic-string。
struct sdshdr{
    int len; 字符个数,不包括‘/0’
    int free; 没有使用的字符个数
    char buf[]; 字符数组
}
空间预分配
空间预分配用于优化SDS的字符串增长操作。
- 如果对sds修改后,len小于1MB,那么分配与len同样大小的未使用空间。buf的长度变为
len+buf+1 - 如果修改后,lend大于等于1MB,那么分配1MB的未使用空间。buf的长度变为
len+1MB+1byte 
惰性空间释放
用于优化SDS的字符串缩短操作
- 进行缩短操作时,不减少buf的长度,将缩短的部分加入free。
 - 同时提供了真正释放未使用空间的API,不用担心内存浪费
 
C字符串与SDS对比
| C字符串 | SDS | 
|---|---|
| 获取字符串长度复杂度O(n) | 复杂度O(1) | 
| API不安全,可能缓冲区溢出 | API安全 | 
| 修改字符串长度N次必然需要执行N次内存重分配 | 修改字符串长度N次最多需要N次内存重分配 | 
| 只能保存文本数据 | 可以保存文本或者二进制数据 | 
| 可以使用所有<string.h>库中的函数 | 可以使用部分 | 
链表
链表在redis中应用广泛,当一个列表键包含了数量较多的元素,又或者列表包含的元素都是比较长的字符串时,redis就会用链表作为列表键的底层实现。
特性
- 双向, 无环
 - 有表头,表尾指针
 - 带链表长度计数器
 - 多态,可以保存不同类型的值
 
字典
应用广泛。整个数据库就是一个kv数据库,其次哈希键这个数据结构的底层也是字典。
哈希表结构
typedef struct dictht {
    // 哈希表数组
    dictEntry **table;
    // 哈希表大小
    unsigned long size;
    // 哈希表大小掩码,用于计算索引值,总是等于size-1
    unsigned long sizemask;
    // 该哈希表已有节点数量
    unsigned long used;
} dictht;
哈希表节点结构
typedef struct dictEntry {
    void *key;
    union(
        void *val;
        uint64_tu64;
        int64_ts64;
    ) v;
    struvt dictEntry *next;
} dictEntry;
字典结构
typedef struct dict {
    // 类型特定函数
    dictType *type;
    // 私有数据
    void *privdata;
    // 哈希表
    dictht ht[2];
    // rehash索引, 当rehash不在进行时,值为-1
    int trehashidx;
} dict;
字典保存在ht[0]中,ht[1]用来对哈希表进行rehash。使用MurmueHash算法。数组+链表的方式解决哈希冲突。
rehash优化-渐进式rehash
如果字典表过大,一次完成rehash会造成数据库在一段时间停止服务。步骤如下:
- 为ht[1]分配空间
 - 在字典中维持一个索引计数器变量rehashidx,并将值置为0
 - 在rehash期间,每次对字典进行添加删除,查找或者更新操作时,顺带将ht[0]哈希表在rehashidx索引上的所有键值对rehash到ht[1],完成后rehashidx+1
 - 最终全部rehash到ht[1], 将rehashidx设为-1表示完成。把ht[0]的哈希表指向ht[1]的哈希表,ht[1]指向null。
 
压缩列表
压缩列表是列表和哈希的底层实现之一,当一个列表键只包含少量列表项,并且是小整数值或短字符串。同时满足以下两点,使用压缩链表。
- 列表对象保存的所有字符串长度都小于64字节
 - 列表对象保存的元素数量小于512个
 
跳跃表
redis使用跳跃表作为有序集合的底层实现之一,同时也用在集群节点中用作内部数据结构。可以参考网上跳表数据结构分析。(个人感觉与二分的思想是一致的,有序情况下降低复杂度)
set
集合数据结构靠字典实现,集合的值为字典的键,对应的值为null。