Redis的几种数据结构

Redis的几种数据结构：

1.SDS(动态字符串)

SDS存储String类型的数据，底层是一个char[]，同时会维护字符串的长度，和申请的内存大小，动态扩容如下机制：

1. 如果扩容后的新字符串小于1M，则申请新的内存空间为扩展后的字符串长度的两倍+1；

2.如果新字符串大于1M，则申请的新空间为扩展后字符串长度 + 1M +1。

2.IntSet

InstSet底层是一个整数数组，同时会维护数组的编码方式（类似short、int、long）和元素个数。同时数组中的整数是唯一的，升序的。如果新添加的数字超过了编码方式的范围，则会进行扩容，扩容机制如下：

1.将编码方式升级；

2.倒序一次将数组中的元素拷贝到扩容后的正确位置;

3.将添加的元素放入数组末尾;

如果长度超了，则将数组复制到一个更大的数组里面。

3.Dict

Dict由三个部分组成，分别是：

字典：维护字典的类型， 两个哈希表， reHash的进度， reHash是否暂停；

哈希表：维护指向哈希节点数组的指针、哈希表大小、哈希表大小的掩码、哈希节点的个数；

哈希节点：维护一个键值对和指向下一个节点的指针；

Ditc中的HashTable就是数组结合单向链表的实现，当集合中元素较多时，会导致哈希冲突的增多，链表过长，查询效率降低，所以Dict每次新增键值对时都会检测负载因子，如果负载因子过大或时会进行哈希表的扩容，同时如果负载因子很小的话，会进行哈希表的收缩。哈希表的扩容和收缩机制如下：

1. 计算新的哈希表的大小，按照新的哈希表大小申请内存空间，用于创建哈希表，并赋值给字典中的两个哈希表中的空哈希表。

2. 将字典中的reHash进度和reHash是否暂停字段更新。

3.将数据渐进式的迁移至新的哈希表中，每次执行新增、查询、修改、删除操作时，都将reHash的进度上的数据迁移至新哈希表中，然后将reHash进度++，直到所有数据迁移完毕。在reHash的过程中，新增操作直接写入新哈希表中，其他操作均需要查询两张表寻找数据。

4.会将新的哈希表重新赋值给旧的空哈希表，然后释放新哈希表的内存空间。

4.ZipList

ZipList是一个特殊的双端列表，由一系列特殊编码的连续内存块组成，可以在任意一端进行压入/弹出操作。其内部维护ziplist的总字节数、尾偏移量、节点数量（最大65535个）、各节点、尾标识（0fff）。其中，每一个节点中包含前一个节点的长度（用于遍历）、节点编码信息（数据类型：字符串还是整数，和数据长度）,节点数据。

5.QuickList

ZipList虽然节省内存，但是申请内存必须是连续的，如果内存占用过多，申请内存的效率会很低。为了解决这个问题，可以创建多个ZipList来分片储存数据，然后使用QuickList来管理拆分后的数据。QuickListu是一个双端链表，每一个节点都是一个ZipList。为了避免每个ZipList的长度过大，可以配置每一个ZipList的最大长度用来控制ZipList的大小。除了控制ZipList的大小，QuickList还可以对节点的ZipList做压缩，因为链表都是首尾访问较多，所以首尾不压缩，中间的节点压缩，进一步节省了内存。

6.SkipList

SkipList是一个的双向链表，每个节点都包含了score和数据，节点按照score值排序，score一样则按照数据值字典排序，每个节点都可以包含多层指针，层数是1到32之间的随机数，不同层指针到下一个节点的跨度不同，层级越高，跨度越大。增删改查效率与红黑树基本一致，但是实现简单。

7.RedisObject ： Redis基类

Redis中的任意数据类型的键和值都会被封装为一个RedisObject，源码如下

Redis五种数据类型：

1.String：其基本编码方式是RAW，基于简单动态字符串(SDS)实现，储存上限为512Mb。

如果储存的SDS长度小于44字节，则会采用EMBSTR编码，此时object head与SDS是一段连续空间，申请内存时只需要调用一次内存分配函数，效率更高。如果储存的字符串是整数值，并且大小在LONG_MAX范围内，则会采用INT编码，直接将数据保存在RedisObject的ptr指针位置（刚好8字节）。

2.List：使用QuickList实现。

3.Set：其集合中元素都是唯一的，可以判断元素是否存在。一般使用HT编码，由Dict实现，key储存数据，value为null。当储存的数据都是整数时，且数量不超过配置值，会采用IntSet编码，以节省内存。

4.ZSet：是一个SortedSet，其中每一个元素都需要指定一个score值和member值。一般由SkipList组合Dict实现。如果元素数量不多时，会采用ZipList来实现。

5.Hash：默认由ZipList实现，相邻的两个节点前一个储存field，后一个储存value。如果数据量较大时，Hash结果会转为HT编码，使用Dict实现。

Redis的几种数据结构