redis入门(四) redis底层结构简介(哈希表，跳跃表，压缩列表，整数数组，基数统计)

一些常用的redis结构,底层实现及方法

哈希表

在redis当中，使用哈希表作为字典的底层实现，底层是数组+链表
在向里面添加元素时候，需要计算其索引位置：index = hash & dict->ht[x].sizemask()**
哈希表采用链地址法来解决哈希冲突
rehash--使哈希表的大小总处在一个合理的大小，rehash的过程，是另一个哈希表（h[0]或者h[1]）（大小增大或者减小2倍），然后将数据迁移过去。考虑数据量一般都是渐进式rehash，将迁入的过程包含在对数据库的操作过程中

跳跃表

跳跃表与跳表是相同的目的，为链表加快查询，使用抛硬币法决定其是否上升
有序集合键的底层实现
通过在每个节点维持多个指向其他节点的指针，达到快速访问下一个节点的目的
redis里面的跳跃表由两部分组成
1，zipNod(头)： herd（头指针）,tail(尾指针),level(最大层数),length(长度)
2，zipList(节点)：由前进指针和跨度组成（跨度表示两个节点之间的距离，跨度是用来计算排序的，前进指针是指向后面节点的指针）
跳跃表的结构如下所示

跳跃表结构

调表建立过程

跳跃表的核心就是其的查找操作。举个例子，比如要查找14，从头节点最高开始，指向9，9<14,所以继续向后查找到21，21>14，这个时候9这个节点的指针下移，下一个节点是17，17>14.继续下移12，12.小于该节点，到12节点，由于12节点之后是已经指向过的17，所以最后没有查找到这个节点，如果这个时候需要加入，则将新建节点，链到12后面，使用抛硬币的方法判断其是否上升，上升的话，底层依旧是12->14->17,第二层就是9->14->17.再用抛硬币法判断其是否上升
删除同样道理，就是没有增加抛硬币的做法

整数数组

redis的整数数组结构里面就是结构体里面套数组，特殊支持，就是数组的升级策略（encoding属性从16->32->64）升级之后相应数组的节点大小就会相应扩大(O(N))，升级策略的目的是为了节约内存，提高灵活性。
整数集合·不支持降级操作

压缩列表

压缩列表是列表键和哈希键的底层实现（目的---节约内存）
由一系列特殊编码的连续内存块组成的顺序数据结构（redis里面压缩列表结构如下）

压缩列表结构

节点里面有一个字段previous_entry_length记录了前一个节点的长度，长度小于254字节，则需要1字节去存储，大于则就用5字节存储，而插入新节点的时候可能第一个节点的长度>244,造成原来e1节点的长度变大，造成连锁跟新的情况。同理，删除节点也会造成连锁跟新。

HyperLogLog-基数统计

Redis HyperLogLog 是用来做基数统计的算法，基数-及所输入元素当中的不重复的元素个数。HyperLogLog 的优点是，在输入元素的数量或者体积非常非常大时，计算基数所需的空间总是固定的、并且是很小的。在 Redis 里面，每个 HyperLogLog 键只需要花费 12 KB 内存，就可以计算接近 2^64 个不同元素的基数。redis只会根据输入元素来统计基数，而不会存储数据。
常用命令：
PFADD key element [element ...]]:添加指定元素到 HyperLogLog 中。 |
|[PFCOUNT key [key ...]:返回给定 HyperLogLog 的基数估算值。 |
[PFMERGE destkey sourcekey [sourcekey ...]]:
将多个 HyperLogLog 合并为一个 HyperLogLog |

eg:

HyperLogLog

参考：小绿书

redis入门(四) redis底层结构简介(哈希表，跳跃表，压缩列表，整数数组，基数统计)