Redis的几种数据结构:
1.SDS(动态字符串)
SDS存储String类型的数据,底层是一个char[],同时会维护字符串的长度,和申请的内存大小,动态扩容如下机制:
1. 如果扩容后的新字符串小于1M,则申请新的内存空间为扩展后的字符串长度的两倍+1;
2.如果新字符串大于1M,则申请的新空间为扩展后字符串长度 + 1M +1。
2.IntSet
InstSet底层是一个整数数组,同时会维护数组的编码方式(类似short、int、long)和元素个数。同时数组中的整数是唯一的,升序的。如果新添加的数字超过了编码方式的范围,则会进行扩容,扩容机制如下:
1.将编码方式升级;
2.倒序一次将数组中的元素拷贝到扩容后的正确位置;
3.将添加的元素放入数组末尾;
如果长度超了,则将数组复制到一个更大的数组里面。
3.Dict
Dict由三个部分组成,分别是:
字典:维护字典的类型, 两个哈希表, reHash的进度, reHash是否暂停;
哈希表:维护指向哈希节点数组的指针、哈希表大小、哈希表大小的掩码、哈希节点的个数;
哈希节点:维护一个键值对和指向下一个节点的指针;
Ditc中的HashTable就是数组结合单向链表的实现,当集合中元素较多时,会导致哈希冲突的增多,链表过长,查询效率降低,所以Dict每次新增键值对时都会检测负载因子,如果负载因子过大或时会进行哈希表的扩容,同时如果负载因子很小的话,会进行哈希表的收缩。哈希表的扩容和收缩机制如下:
1. 计算新的哈希表的大小,按照新的哈希表大小申请内存空间,用于创建哈希表,并赋值给字典中的两个哈希表中的空哈希表。
2. 将字典中的reHash进度和reHash是否暂停字段更新。
3.将数据渐进式的迁移至新的哈希表中,每次执行新增、查询、修改、删除操作时,都将reHash的进度上的数据迁移至新哈希表中,然后将reHash进度++,直到所有数据迁移完毕。在reHash的过程中,新增操作直接写入新哈希表中,其他操作均需要查询两张表寻找数据。
4.会将新的哈希表重新赋值给旧的空哈希表,然后释放新哈希表的内存空间。
4.ZipList
ZipList是一个特殊的双端列表,由一系列特殊编码的连续内存块组成,可以在任意一端进行压入/弹出操作。其内部维护ziplist的总字节数、尾偏移量、节点数量(最大65535个)、各节点、尾标识(0fff)。其中,每一个节点中包含前一个节点的长度(用于遍历)、节点编码信息(数据类型:字符串还是整数,和数据长度),节点数据。
5.QuickList
ZipList虽然节省内存,但是申请内存必须是连续的,如果内存占用过多,申请内存的效率会很低。为了解决这个问题,可以创建多个ZipList来分片储存数据,然后使用QuickList来管理拆分后的数据。QuickListu是一个双端链表,每一个节点都是一个ZipList。为了避免每个ZipList的长度过大,可以配置每一个ZipList的最大长度用来控制ZipList的大小。除了控制ZipList的大小,QuickList还可以对节点的ZipList做压缩,因为链表都是首尾访问较多,所以首尾不压缩,中间的节点压缩,进一步节省了内存。
6.SkipList
SkipList是一个的双向链表,每个节点都包含了score和数据,节点按照score值排序,score一样则按照数据值字典排序,每个节点都可以包含多层指针,层数是1到32之间的随机数,不同层指针到下一个节点的跨度不同,层级越高,跨度越大。增删改查效率与红黑树基本一致,但是实现简单。
7.RedisObject : Redis基类
Redis中的任意数据类型的键和值都会被封装为一个RedisObject,源码如下
Redis五种数据类型:
1.String:其基本编码方式是RAW,基于简单动态字符串(SDS)实现,储存上限为512Mb。
如果储存的SDS长度小于44字节,则会采用EMBSTR编码,此时object head与SDS是一段连续空间,申请内存时只需要调用一次内存分配函数,效率更高。如果储存的字符串是整数值,并且大小在LONG_MAX范围内,则会采用INT编码,直接将数据保存在RedisObject的ptr指针位置(刚好8字节)。
2.List:使用QuickList实现。
3.Set:其集合中元素都是唯一的,可以判断元素是否存在。一般使用HT编码,由Dict实现,key储存数据,value为null。当储存的数据都是整数时,且数量不超过配置值,会采用IntSet编码,以节省内存。
4.ZSet:是一个SortedSet,其中每一个元素都需要指定一个score值和member值。一般由SkipList组合Dict实现。如果元素数量不多时,会采用ZipList来实现。
5.Hash:默认由ZipList实现,相邻的两个节点前一个储存field,后一个储存value。如果数据量较大时,Hash结果会转为HT编码,使用Dict实现。