Redis对象
在了解Redis数据结构的时候我们会学习到简单动态字符串,压缩链表等。
但Redis并没有直接使用这些数据结构来实现键值对数据库,而是基于这些数据结构创建了一个对象系统,这个系统包含字符串对象、列表对象、哈希对象、集合对象和有序集合对象这五种类型的对象。Redis使用对象表示键和值,每次新建一个键值对时,我们就创建了两个对象。
创建一个key为msg,value为hello的键值对。
127.0.0.1:6379> set msg "hello"
OK
就在内存中创建了一个"msg"的字符串对象和一个"hello"的字符串对象。
每个对象包含三个属性,type,encoding,ptr。
typedef struct redisObject {
// 类型
unsigned type:4;
// 编码
unsigned encoding:4;
// 指向底层实现数据结构的指针
void *ptr;
}
可以通过type和object encoding命令查看他们。
127.0.0.1:6379> type list
list
127.0.0.1:6379> type msg
string
127.0.0.1:6379> object encoding msg
"embstr"
type就是list,String这些我们熟悉的数据结构,type决定了我们如何对redis对象进行操作
embstr是String的一种编码方式,encoding决定了这个对象如何存储在内存当中,同一种数据结构使用不同的编码它的内存模型就会有很大的区别
接下来从同一对象不同编码方式的数据结构进行详细的介绍。
字符串对象
一个字符串对象
当我们要操作一个字符串对象时,我们可以用set,get,append等命令操作这个对象
通过set创建三种不同编码的字符串对象
127.0.0.1:6379> set num 10086
OK
127.0.0.1:6379> object encoding num
"int"
127.0.0.1:6379> set str "hello"
OK
127.0.0.1:6379> object encoding str
"embstr"
127.0.0.1:6379> set str2 "helldsadddddddsadhsjjjjsadasdsaddadadafzo"
OK
127.0.0.1:6379> object encoding str2
"raw"
127.0.0.1:6379> type str2
string
127.0.0.1:6379> type num
string
127.0.0.1:6379> type str
string
为什么都是通过set生成的字符串对象会有三种不同的编码?
redis的作者为了尽可能的提高内存的利用率,针对不同类型和不同长度的的数据设计了不同的存储模型,毕竟内存可不比磁盘,在redis中空间永远是优先考虑的。
int编码
何时为int编码?
当set的对象value为一个整数时,浮点数仍然会作为embstr处理。
这是一个内容为10086的字符串对象,它的type是string,encoding是int。
ptr存储的是10086的地址。而且redis中所有整数的对象时共享的,也就是说再建立一个存储10086的字符串对象,这个新的字符串对象ptr指向的地址是同一个。
raw编码
当字符串传入的是非整数并且长度大于42时,使用raw编码存储字符串。
介绍raw之前我们先要了解redis中的SDS数据结构,简单动态字符串。
这是一个内容为"Redis"的SDS。
free为0,表示为使用的空间为0;len为5,表示这个字符串长度为5;buf是一个char类型的数组,\0结尾表示它是一个C字符串。
SDS与C字符串的不同在于直接存储了字符串长度,提高获取字符串长度的速度;防止了缓冲区溢出,不管拼接还是截器字符串都先通过len分配好内存空间再进行字符串操作;使用动态分配内存的策略,字符串拼接时将free的值和len的值相同,也就是扩容为两倍,截取时剩余的空间不立即释放,减小重新分配内存的次数。
sds的buf的底层实现是二进制安全的,所有SDS API都会以处理二进制的方式来处理SDS存放在buf数组里的数据,程序不会对其中的数据做任何限制、过滤、或者假设,数据在写入时是什么样的,它被读取时就是什么样。所以我们才能使用sds来存储图片和文件等数据。
raw编码的string对象就是令ptr指向保存该键值对value的sds,每次创建一个raw编码的string对象redis就会开辟两块内存空间,一块保存redisObject,一块保存sds
embstr编码
当字符串传入的是非整数并且长度小于42时,使用embstr编码存储字符串。
embstr编码的string对象的数据结构是一个object结构和一个sds结构一起连续构成的,这样在创建和销毁对象时只需要进行一次内存分配,raw则需要两次。
同样因为embstr编码的sds是和redisObject存储在一起的,所以当我们为对一个embstr编码的string对象进行append操作时(为该字符串增加内容),这个对象的编码方式会自动从embstr转换为raw,避免对其他redisObject进行内存的重新分配。
127.0.0.1:6379> object encoding msg
"embstr"
127.0.0.1:6379> append msg "hello"
(integer) 10
127.0.0.1:6379> object encoding msg
"raw"
string对象的相关命令