intset(整数集合)是集合键的底层实现之一,当一个集合只包含整数,并且数量不多的时候,Redis就会使用整数集合作为集合键的底层实现
整数集合的实现
intset是Redis中用来保存整数值的集合抽象数据结构,可以保存int16_t,int32_t,int64_t的整数值,并且保证集合中不会出现重复的,从小到大有序排序
typedef struct intset{
//编码方式
uint32_t encoding;
//集合包含的元素数量
uint32_t length;
//保存元素的数组
int8_t contents[];
}intset;
contents数组的真正类型取决于encoding属性的值:
encoding:INTSET_ENC_INT16,那么contents就是一个int16_t类型的数组(-32768到32767)
encoding:INTSET_ENC_INT32,那么contents就是一个int32_t类型的数组(-2147483648到2147483647)
encoding:INTSET_ENC_INT64,那么contents就是一个int64_t类型的数组(-9223372036854775808到9223372036854775807)
contents数组的大小等于sizeof(int16_t)*5=16*5=80位
升级
当我们要将一个新元素添加到整数集合中,并且新元素的类型比整数集合现有的所有元素类型都要长的时候,整数集合需要先进行升级,然后才能将新元素添加到整数集合中
升级步骤:
根据新元素的类型,扩展整数集合底层数组的空间大小,并为新元素分配空间
把底层数组现有的所有元素都转换为与新元素相同的类型,并将类型转换后的元素放到正确的位上,而且在防止元素的过程中,需要维持底层数组的有序性不变
将新元素添加到底层数组中
举例:
contents底层数组大小3*16=48,下面是3个元素在48位中的位置
位 | 0-15位 | 16到31位 | 32到47位 |
---|---|---|---|
元素 | 1 | 2 | 3 |
将65535添加进去,这个是int32_t类型的,所以要对contents进行升级
对底层数组做空间重分配,32*4=128位
位 | 0-15位 | 16到31位 | 32到47位 | 48到127位 |
---|---|---|---|---|
元素 | 1 | 2 | 3 | 新分配空间 |
位 | 0-15位 | 16到31位 | 32到47位 | 48到63位 | 64到95位 | 96到127位 |
---|---|---|---|---|---|---|
元素 | 1 | 2 | 3 | 新分配空间 | 3 | 新分配空间 |
位 | 0-15位 | 16到31位 | 32到63位 | 64到95位 | 96到127位 |
---|---|---|---|---|---|
元素 | 1 | 2 | 2 | 3 | 新分配空间 |
位 | 0-31位 | 32到63位 | 64到95位 | 96到127位 |
---|---|---|---|---|
元素 | 1 | 2 | 3 | 新分配空间 |
位 | 0-31位 | 32到63位 | 64到95位 | 96到127位 |
---|---|---|---|---|
元素 | 1 | 2 | 3 | 65535 |
升级的好处
- 提升整数集合的灵活性
c语言是静态类型语言,为了避免类型错误,通常不会将两种不同类型的值放到一个数据结构中,但是通过自动升级底层数组来适应新元素,可以随意将int16_t,int32_t,int64_t类型的整数添加到集合中,不必担心类型错误
- 尽可能的节约内存
如果直接使用int64_t作为底层数组的实现,当然可以同时保持所有了,但是如果存的都是int16_t,或者都是int32_t类型的值,就会浪费内存了,而升级只会让他在需要的时候进行升级,这样可以尽量节省内存
降级
intset不支持降级操作,一旦对数组做了升级,编码就会一直保持升级后的状态,即使将int64_t类型的数删除了,编码仍然是int64_t
整数集合API
函数 | 作用 | 时间复杂度 |
---|---|---|
intsetNew | 创建一个新的压缩列表 | O(1) |
intsetAdd | 将给定元素添加到整数集合中 | O(N) |
intsetRemove | 从整数集合中移除给定元素 | O(N) |
intsetFind | 检查给定值是否存在于集合中 | 有序,可以通过二分查找O(logN) |
intsetRandom | 从整数集合中随机返回一个元素 | O(1) |
intsetGet | 取出底层数组在给定索引上的元素 | O(1) |
intestLen | 返回整数集合中包含元素的个数 | O(1) |
intsetBlobLen | 返回整数集合占用的内存字节数 | O(1) |