Redis——数据类型之String

介绍   

    字符串类型是Redis最基础的数据结构。首先键都是字符串类型,而且其他几种数据结构都是在字符串类型基础上构建的,所以字符串类型能为其他四种数据结构的学习奠定基础。

应用场景

    用户的session、h5上传包的地址的配置、特定错误信息的配置、令牌桶数量控制、某些银行维护时间配置、可以作为自增值。

常用命令


底层数据结构

    字符串类型的内部编码有3种:

int:8个字节的长整型。

embstr:小于等于39个字节的字符串。

raw:大于39个字节的字符串

    Redis会根据当前值的类型和长度决定使用内部编码实现。

对于embstr和raw来说,编码格式不同,但是底层都是通过SDS(简单字符串)来实现的。接下来咱们介绍一下SDS,之后再分析一下embstr和raw的区别。

struct sdshdr{

    int len;//已使用保存的字符串长度

    int free;//未使用字符串长度

    char buf[];保存字符串的数组

}

示例

free属性值为0,说明这个SDS没有分配任何未使用空间。

len属性值为5,这个SDS保存了一个五字节长的字符串。

buf属性是一个char类型的数组,前面五个字节保存了Redis,最后一个字节为空字符'\0'。

    SDS遵循C字符串以空字符串结尾,SDS可以直接重用一部分C字符串函数库里面的函数。

SDS的优点:

1、计算字符串长度方便,时间负责度降低

2、杜绝缓存溢出。对字符串进行修改的时候,对于C字符串,可能会产生覆盖,因为再进行修改的时候,会先进行申请空间(程序员主动申请的),如果忘记申请就会出现将其他空间位置的数据覆盖。而SDS在进行处理的时候会先判断容量是否满足(掉用API后是由系统来做的),如果不满足会先进行扩容,再进行赋值,杜绝缓存溢出的情况出现

3、SDS减少了修改字符串带来的内存重分配的次数。C字符串的底层实现总是一个长度为N+1个字符长度的数组(多了一个空字符)。每次增长和缩短一个字符串,程序都要堆这个数组进行一次内存重分配。

        SDS采用未使用的空间解除了字符串长度和底层数组长度之间的关联。通过未使用空间,SDS实现了空间预分配和惰性空间释放的策略。

       空间分配:

            用于优化SDS的字符串增长操作:当程序未使用的空间满足新增的字符串,则不会进行扩展。当需要进行空间扩展的时候,程序不仅会为程序分配空间,还会为SDS分配额外的未使用空间。(1)、如果修改之后SDS的长度小于1MB,程序分配和len同样大小的未使用空间。(2)、如果大于等于1MB,那么程序会分配1MB的未使用空间。

            例:如果原来字符长度为5个字节,现在变为13个字节,那么未分配的空间为13个字节

       惰性空间释放:    

            惰性空间释放用于优化SDS的字符串缩短操作,程序不立即使用内存分配来回收算断后多出来的字节,而是使用free属性将这些没用的字节数量记录下来,等待接下来的使用。

      例:


二进制安全

    C字符串中的字符必须符合某种编码,字符串里面不能包含空字符串,所以限制不能保存像图片、音频、视频、压缩文件这样的二进制数据。

    SDS的API都是二进制安全的,所有的SDS API都会以处理二进制的方式处理SDS存放在buf数组里面的数据,不会对里面的数据做任何限制、过滤或者假设,数据在写入是什么样的,读取就是什么样的。因为SDS使用len的属性值来判断字符串是否结束。

SDS字符串和C字符串区别总结:


SDS说完了,那么embstr和raw区别是什么?

    Redis中每个对象都由一个redisObject结构表示,该结构和保存数据相关的有三个属性分别是type 属性、encoding属性和ptr属性:

typedef struct redisObject {

    // 类型

    unsigned type:4;

    // 编码

    unsigned encoding:4;

    // 对象最后一次被访问的时间

    unsigned lru:REDIS_LRU_BITS; /* lru time (relative to server.lruclock) */

    // 引用计数

    int refcount;

    // 指向实际值的指针

    void *ptr;

} robj;

    如果小于等于39个字节的字符串,采用embstr内部编码。、

这两种有什么区别?

申请内存的方式不同

    两种方式都使用redisObject结构和sdshdr结构来表示字符串对象,但是raw编码会调用两次内存分配函数来分别创建redisObject结构和sdshdr结构,而embstr编码则通过调用一次内存分配函数来分配一块连续的空间,空间中依次包含redisObject和sdshdr两个结构。

释放内存方式的不同

   embstr只需要调用一次内存释放函数,而raw编码的字符串对象需要调用两次内存释放函数。 

缓存优势更加明显  

    因为embstr字符串对象的所有数据都保存在一块连续的内存里面,所以效率更高。

注意:

    int编码的字符串对象和embstr编码的字符串对象在条件满足的情况下,会被转化为raw编码的字符串对象。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容