介绍
字符串类型是Redis最基础的数据结构。首先键都是字符串类型,而且其他几种数据结构都是在字符串类型基础上构建的,所以字符串类型能为其他四种数据结构的学习奠定基础。
应用场景
用户的session、h5上传包的地址的配置、特定错误信息的配置、令牌桶数量控制、某些银行维护时间配置、可以作为自增值。
常用命令
底层数据结构
字符串类型的内部编码有3种:
int:8个字节的长整型。
embstr:小于等于39个字节的字符串。
raw:大于39个字节的字符串
Redis会根据当前值的类型和长度决定使用内部编码实现。
对于embstr和raw来说,编码格式不同,但是底层都是通过SDS(简单字符串)来实现的。接下来咱们介绍一下SDS,之后再分析一下embstr和raw的区别。
struct sdshdr{
int len;//已使用保存的字符串长度
int free;//未使用字符串长度
char buf[];保存字符串的数组
}
示例
free属性值为0,说明这个SDS没有分配任何未使用空间。
len属性值为5,这个SDS保存了一个五字节长的字符串。
buf属性是一个char类型的数组,前面五个字节保存了Redis,最后一个字节为空字符'\0'。
SDS遵循C字符串以空字符串结尾,SDS可以直接重用一部分C字符串函数库里面的函数。
SDS的优点:
1、计算字符串长度方便,时间负责度降低
2、杜绝缓存溢出。对字符串进行修改的时候,对于C字符串,可能会产生覆盖,因为再进行修改的时候,会先进行申请空间(程序员主动申请的),如果忘记申请就会出现将其他空间位置的数据覆盖。而SDS在进行处理的时候会先判断容量是否满足(掉用API后是由系统来做的),如果不满足会先进行扩容,再进行赋值,杜绝缓存溢出的情况出现
3、SDS减少了修改字符串带来的内存重分配的次数。C字符串的底层实现总是一个长度为N+1个字符长度的数组(多了一个空字符)。每次增长和缩短一个字符串,程序都要堆这个数组进行一次内存重分配。
SDS采用未使用的空间解除了字符串长度和底层数组长度之间的关联。通过未使用空间,SDS实现了空间预分配和惰性空间释放的策略。
空间分配:
用于优化SDS的字符串增长操作:当程序未使用的空间满足新增的字符串,则不会进行扩展。当需要进行空间扩展的时候,程序不仅会为程序分配空间,还会为SDS分配额外的未使用空间。(1)、如果修改之后SDS的长度小于1MB,程序分配和len同样大小的未使用空间。(2)、如果大于等于1MB,那么程序会分配1MB的未使用空间。
例:如果原来字符长度为5个字节,现在变为13个字节,那么未分配的空间为13个字节
惰性空间释放:
惰性空间释放用于优化SDS的字符串缩短操作,程序不立即使用内存分配来回收算断后多出来的字节,而是使用free属性将这些没用的字节数量记录下来,等待接下来的使用。
例:
二进制安全
C字符串中的字符必须符合某种编码,字符串里面不能包含空字符串,所以限制不能保存像图片、音频、视频、压缩文件这样的二进制数据。
SDS的API都是二进制安全的,所有的SDS API都会以处理二进制的方式处理SDS存放在buf数组里面的数据,不会对里面的数据做任何限制、过滤或者假设,数据在写入是什么样的,读取就是什么样的。因为SDS使用len的属性值来判断字符串是否结束。
SDS字符串和C字符串区别总结:
SDS说完了,那么embstr和raw区别是什么?
Redis中每个对象都由一个redisObject结构表示,该结构和保存数据相关的有三个属性分别是type 属性、encoding属性和ptr属性:
typedef struct redisObject {
// 类型
unsigned type:4;
// 编码
unsigned encoding:4;
// 对象最后一次被访问的时间
unsigned lru:REDIS_LRU_BITS; /* lru time (relative to server.lruclock) */
// 引用计数
int refcount;
// 指向实际值的指针
void *ptr;
} robj;
如果小于等于39个字节的字符串,采用embstr内部编码。、
这两种有什么区别?
申请内存的方式不同
两种方式都使用redisObject结构和sdshdr结构来表示字符串对象,但是raw编码会调用两次内存分配函数来分别创建redisObject结构和sdshdr结构,而embstr编码则通过调用一次内存分配函数来分配一块连续的空间,空间中依次包含redisObject和sdshdr两个结构。
释放内存方式的不同
embstr只需要调用一次内存释放函数,而raw编码的字符串对象需要调用两次内存释放函数。
缓存优势更加明显
因为embstr字符串对象的所有数据都保存在一块连续的内存里面,所以效率更高。
注意:
int编码的字符串对象和embstr编码的字符串对象在条件满足的情况下,会被转化为raw编码的字符串对象。