一些常用的redis结构,底层实现及方法
哈希表
在redis当中,使用哈希表作为字典的底层实现,底层是数组+链表
在向里面添加元素时候,需要计算其索引位置:index = hash & dict->ht[x].sizemask()**
哈希表采用链地址法来解决哈希冲突
rehash--使哈希表的大小总处在一个合理的大小,rehash的过程,是另一个哈希表(h[0]或者h[1])(大小增大或者减小2倍),然后将数据迁移过去。考虑数据量一般都是渐进式rehash,将迁入的过程包含在对数据库的操作过程中
跳跃表
跳跃表与跳表是相同的目的,为链表加快查询,使用抛硬币法决定其是否上升
有序集合键的底层实现
通过在每个节点维持多个指向其他节点的指针,达到快速访问下一个节点的目的
redis里面的跳跃表由两部分组成
1,zipNod(头): herd(头指针),tail(尾指针),level(最大层数),length(长度)
2,zipList(节点): 由前进指针和跨度组成(跨度表示两个节点之间的距离,跨度是用来计算排序的,前进指针是指向后面节点的指针)
跳跃表的结构如下所示
跳跃表的核心就是其的查找操作。举个例子,比如要查找14,从头节点最高开始,指向9,9<14,所以继续向后查找到21,21>14,这个时候9这个节点的指针下移,下一个节点是17,17>14.继续下移12,12.小于该节点,到12节点,由于12节点之后是已经指向过的17,所以最后没有查找到这个节点,如果这个时候需要加入,则将新建节点,链到12后面,使用抛硬币的方法判断其是否上升,上升的话,底层依旧是12->14->17,第二层就是9->14->17.再用抛硬币法判断其是否上升
删除同样道理,就是没有增加抛硬币的做法
整数数组
redis的整数数组结构里面就是结构体里面套数组,特殊支持,就是数组的升级策略(encoding属性从16->32->64)升级之后相应数组的节点大小就会相应扩大(O(N)),升级策略的目的是为了节约内存,提高灵活性。
整数集合·不支持降级操作
压缩列表
压缩列表是列表键和哈希键的底层实现(目的---节约内存)
由一系列特殊编码的连续内存块组成的顺序数据结构(redis里面压缩列表结构如下)
节点里面有一个字段previous_entry_length记录了前一个节点的长度,长度小于254字节,则需要1字节去存储,大于则就用5字节存储,而插入新节点的时候可能第一个节点的长度>244,造成原来e1节点的长度变大,造成连锁跟新的情况。同理,删除节点也会造成连锁跟新。
HyperLogLog-基数统计
Redis HyperLogLog 是用来做基数统计的算法,基数-及所输入元素当中的不重复的元素个数。HyperLogLog 的优点是,在输入元素的数量或者体积非常非常大时,计算基数所需的空间总是固定 的、并且是很小的。在 Redis 里面,每个 HyperLogLog 键只需要花费 12 KB 内存,就可以计算接近 2^64 个不同元素的基 数。redis只会根据输入元素来统计基数,而不会存储数据。
常用命令:
PFADD key element [element ...]]:添加指定元素到 HyperLogLog 中。 |
|[PFCOUNT key [key ...]:返回给定 HyperLogLog 的基数估算值。 |
[PFMERGE destkey sourcekey [sourcekey ...]]:
将多个 HyperLogLog 合并为一个 HyperLogLog |
参考:小绿书