1. SDS 简单动态字符串
free是sds的剩余空闲空间 len是sds的使用长度
比起C字符串,SDS具有以下优点:
1)常数复杂度获取字符串长度。 SDS有记录字符长度 c语言没有
2)杜绝缓冲区溢出。 SDS在增添字符时先根据len和free判断空间是否足够,不够先扩容再修改,而c语言如果不主动判断扩容会导致缓冲区溢出,
3)减少修改字符串长度时所需的内存重分配次数。 SDS的扩容 在buf大小小于1MB时翻倍 +1 大于1MB时 额外增加1MB, 通过空间预分配和惰性空间分配减少内存再分配次数
4)二进制安全。 C语言以‘\0‘ 空白字符占位作为结束符 只能存储文本 ,而 SDS以len的长度来判定结尾
5)兼容部分C字符串函数
2. 双端链表
就比较正常的双端链表结构,没啥好说的
3. 字典 hash表
类似于java的hashmap
key属性保存着键值对中的键,而v属性则保存着键值对中的值,其中键值对的值可以是一个指针,或者是一个uint64_t整数,又或者是一个int64_t整数, next指针指向下一个hash节点 来解决hash冲突问题 ,类似于 jdk1.7的 hashmap
type属性和privdata属性是针对不同类型的键值对,为创建多态字典而设置的,hash数据默认存储在ht[0]上,
trehashidx 这个参数 为-1 不处于 rehash状态,
rehash过程:
1)为字典的ht[1]哈希表分配空间,这个哈希表的空间大小取决于要执行的操作,以及ht[0]当前包含的键值对数量(也即是ht[0].used属性的值):❑如果执行的是扩展操作,那么ht[1]的大小为第一个大于等于ht[0].used*2的2 n(2的n次方幂);❑如果执行的是收缩操作,那么ht[1]的大小为第一个大于等于ht[0].used的2 n。
2)将保存在ht[0]中的所有键值对rehash到ht[1]上面:rehash指的是重新计算键的哈希值和索引值,然后将键值对放置到ht[1]哈希表的指定位置上。
3)当ht[0]包含的所有键值对都迁移到了ht[1]之后(ht[0]变为空表),释放ht[0],将ht[1]设置为ht[0],并在ht[1]新创建一个空白哈希表,为下一次rehash做准备。
当以下条件中的任意一个被满足时,程序会自动开始对哈希表执行扩展操作:
1)服务器目前没有在执行BGSAVE命令或者BGREWRITEAOF命令,并且哈希表的负载因子大于等于1。
2)服务器目前正在执行BGSAVE命令或者BGREWRITEAOF命令,并且哈希表的负载因子大于等于5。其中哈希表的负载因子可以通过公式:hash表已保存节点数量/hash表大小
哈希表渐进式rehash
1)为ht[1]分配空间,让字典同时持有ht[0]和ht[1]两个哈希表。
2)在字典中维持一个索引计数器变量rehashidx,并将它的值设置为0,表示rehash工作正式开始。
3)在rehash进行期间,每次对字典执行添加、删除、查找或者更新操作时,程序除了执行指定的操作以外,还会顺带将ht[0]哈希表在rehashidx索引上的所有键值对rehash到ht[1],当rehash工作完成之后,程序将rehashidx属性的值增一。
4)随着字典操作的不断执行,最终在某个时间点上,ht[0]的所有键值对都会被rehash至ht[1],这时程序将rehashidx属性的值设为-1,表示rehash操作已完成
渐进式rehash的好处在于它采取分而治之的方式,将rehash键值对所需的计算工作均摊到对字典的每个添加、删除、查找和更新操作上,从而避免了集中式rehash而带来的庞大计算量
4. 跳跃表
每次创建一个新跳跃表节点的时候,程序都根据幂次定律(power law,越大的数出现的概率越小)随机生成一个介于1和32之间的值作为level数组的大小,这个大小就是层的“高度”
在同一个跳跃表中,各个节点保存的成员对象必须是唯一的,但是多个节点保存的分值却可以是相同的:分值相同的节点将按照成员对象在字典序中的大小来进行排序,成员对象较小的节点会排在前面(靠近表头的方向),而成员对象较大的节点则会排在后面(靠近表尾的方向)
总结: 总共32层 ,层数随机, 每一层都是从小到大排序, 一个跳跃表中分值可以相同但是保存对象是唯一的
5. 整数集合intset
各个项在数组中按值的大小从小到大有序地排列,并且数组中不包含任何重复项
6.ziplist 压缩列表
压缩列表是Redis为了节约内存而开发的
压缩列表的节点的previous_entry_length属性以字节为单位,记录了压缩列表中前一个节点的长度。previous_entry_length属性的长度可以是1字节或者5字节:
❑如果前一节点的长度小于254字节,那么previous_entry_length属性的长度为1字节:前一节点的长度就保存在这一个字节里面。
❑如果前一节点的长度大于等于254字节,那么previous_entry_length属性的长度为5字节:其中属性的第一字节会被设置为0xFE(十进制值254),而之后的四个字节则用于保存前一节点的长度
压缩列表连锁更新问题, :在一个压缩列表中,有多个连续的、长度介于250字节到253字节之间的节点e1至eN, 这时e1的长度进行了修改导致长度大于等于254, 这样下一个节点记录长度的属性就会从1字节变成5字节,从而引起后续字节的连续变动,一连串的内存重分配