整数集合(intset)是集合键的底层实现之一,当一个集合只包含整数值元素,并且这个集合的元素数量不多时,Redis就会使用整数集合作为集合键的底层实现。
1 整数集合的实现
整数集合(intset)是Redis用于整数值的集合抽象数据结构,它可以保存类型为int16_t、int32_t或者int64_t的整数值,并且保证集合中不会出现重复元素。
每个intset结构表示一个整数集合
typedef struct intset{
// 编码方式
uint32_t encoding;
// 集合包含的元素数量
uint32_t length;
// 保存元素的数组
int8_t contents[];
} intset
(1) contents数组是整数集合的底层实现:整数集合的每个元素都是contents数组的一个数组项,各个项在数组中按值的大小从小到大有序得排序,并且数组中不包含任何重复项。
(2) length属性记录了整数集合包含的元素的数量。
(3) 虽然intset结构将contents属性声明为int8_t类型的数组,但是实际上contents数组并不包含任何int8_t类型的值,contents数组的真正类型取决于encoding属性的值:
encodings的取值可以为INTSET_ENC_INT16(-215~215)、INTSET_ENC_INT32、INTSET_ENC_INT64,分别表示contents是一个int16_t、int32_t、int64_t类型的数组,数组中的每个整数值的所占的空间大小分别是16个二进制位、32个二进制位、64个二进制位。
下图展示了一个包含5个int16_t类型的数组
contents数组按照从小到大的顺序保存着集合中的5个元素,每个元素都是int16_t类型的整数值,所以contents数组的大小等于sizeof(int16_t) * 5 = 16 * 5 = 80个二进制位。
2 升级
当将一个新元素添加到整数集合中,并且新元素的类型比整数集合现有的所有元素类型都要长时,整数集合需要先进行升级(upgrade),然后将新元素添加到整数集合中。
升级整数集合并添加新元素共分为三步:
(1) 根据新元素的类型,扩展整数集合底层数组的空间大小,并为新元素分配空间。
(2) 将底层数组现有的所有元素转换成与新元素相同的类型,并将类型转换后的元素放置到正确的位上,而且防止元素的过程中,需要继续维持底层数组的有序性不变。
(3) 将新的元素添加到底层数组里面。
下图表示一个包含三个int16_t类型的元素集合,每个元素占用16个位空间,故一共占用48个位。
现在要在集合中插入一个int32_t类型的整数65535,因为集合中元素类型都是int16_t,所以需要先对整数集合进行升级。首先需要对底层数组进行空间重分配,由于每个元素占32个位,故一共需要128位。
因为元素3在1、2、3和65535四个元素中排第三,故它将会被移动到数组索引为2的位置上,即64至95位上。依次类推,将原来的三个元素放置在正确的位置上。最后,将新元素65535放置在最后一个位置上。
最后,程序将整数集合encoding属性值从INTSET_ENC_INT16改为INTSET_ENC_INT32,并将length属性的值从3改为4,设置完成后的集合如下图所示。
3 升级的好处
3.1 提高灵活性
因为C语言是静态类型语言,为了避免类型错误,通常不会将两种不同类型的值放在同一个数据结构中。
但是,因为整数集合可以通过自动升级底层数组来适应新元素,所以可以随意将int16_t、int32_t或者int64_t类型的整数添加到集合中,而不必担心出现类型错误,这种做法非常灵活。
3.2 节约内存
如果要让一个数组可以同时保存int16_t、int32_t或者int64_t三种类型的值,最简单的就是直接使用int64_t类型的数组作为整数集合的底层实现。不过这样即使数组只保存int16_t类型的数,数组都需要使用int64_t类型的空间去保存它们,从而出现浪费内存的情况。
而整数集合即可以让集合能同时保存三种不同类型的值,又可以确保升级操作只会在有需要的时候进行,可以尽量节省内存。
4 降级
整数集合不支持降级操作,一旦对数组进行了升级,编码就会一直保持升级后的状态。
对于上例,即使删除了65535这个数,集合中剩余的元素虽然可以占用空间更少的int16_t类型保存,但是集合的编码仍然会维持INTSET_ENC_INT32,底层数组也仍然会是int32_t类型。
5 小结
(1) 整数集合的底层实现是数组,这个数组可以有序、无重复的方式保存集合元素,在有需要的时候,程序会根据新添加的元素类型,改变这个数组的类型。
(2) 升级操作为整数集合带来了操作上的灵活性,并且尽可能的节约了内存。
(3) 整数集合支持升级操作,不支持降级操作。
本文完
注:本文参考《Redis设计与实现》,如发现错误,请指正!