2 简单动态字符串

Redis构建了一种名为简单动态字符串(simple dynamic string, SDS)的抽象类型,并将SDS用作redis的默认字符串表示。
Redis中的C字符串只会作为字符串字面量用在一些无需对字符串值进行修改的地方
除了用来保存数据库中的字符串之外,SDS还被用作缓冲区(buffer)

2.1 SDS的定义

sds.h/sdshdr结构表示一个SDS值:

struct sdshdr{
    //记录buf数组中已使用字节的数量
    //等于SDS所保存字符串成的长度
    int len;
    //记录buf数组中未使用字节的数量
    int free;
    //字节数组,用于保存字符串
    char buf[];
};

SDS遵循C字符串以空字符结尾的惯例,但是该操作是由SDS函数自动完成的。

2.2 SDSC字符串的区别

C语言使用长度为N+1的字符数组来表示长度为N的字符串,并且字符数组的最后一个元素总是空字符串'\0'
C语言使用的字符串不能满足Redis对字符串的安全性、效率以及功能方面的要求。

2.2.1 常数复杂度获取字符串长度

C字符串并不记录自身的长度信息,获取一个C字符串的长度,程序必须遍历整个字符串,这个操作的时间复杂度为O(N)
SDSlen属性中记录了SDS的本身的长度,所以获取一个SDS长度的复杂度仅为O(1)
设置和更新SDS长度的工作是由SDSAPI在执行时自动完成的,使用SDS无需进行任何手动修改长度的工作。

2.2.2 杜绝缓冲区溢出

C字符串不记录自身长度带来的另一个问题是容易造成缓冲区溢出(buffer overflow)
C字符串不同,SDS的空间分配策略完全杜绝了发生缓冲区溢出的可能性:当SDS API需要对SDS进行修改时,API会先检查SDS空间是否满足修改所需的要求,如果不满足的话,API会自动将SDS的空间扩展至执行修改所需的大小,然后才执行实际的修改操作,所以使用SDS既不需要手动修改SDS的空间大小,也不会出现前面所说的缓冲区溢出问题。

2.2.3 减少修改字符串时带来的内存重分配次数

SDS通过未使用空间解除了字符串长度和底层数据长度之间的关联:在SDS中,buf数组的长度不一定就是字符数量加一,数组里面可以包含未使用的字节,这些字节的数量就由SDSfree属性记录。
通过未使用空间,SDS实现了空间预分配和惰性空间释放两种优化策略。

1. 空间预分配

空间预分配用于优化SDS的字符串增长操作:当SDSAPI对一个SDS进行修改,并且需要对SDS进行空间扩展的时候,程序不仅会SDS分配修改所必须要的空间,还会为SDS分配额外的未使用空间。
通过空间预分配策略,Redis可以减少连续执行字符串增长操作所需的内存重分配次数。
在扩展SDS空间之前,SDS API会先检查未使用空间是否足够,如果足够的话,API就会直接使用未使用空间,而无需执行内存重分配。

2. 惰性空间释放

惰性空间释放用于优化SDS的字符串缩短操作:当SDSAPI需要缩短SDS保存的字符串,程序不立即使用内存重分配来回收缩短后多出来的字节,而是使用free属性将这些字节的数量记录起来,并等待将来的使用。
通过惰性空间释放策略,SDS避免了缩短字符串时所需要的内存重分配操作,并为将来可能有的增长操作提供了优化。
SDS也提供了相应的API,在有需要的时候,真正释放SDS的未使用空间。

2.2.4 二进制安全

SDSAPI都是二进制安全的,所有SDS API都会以处理二进制的方式来处理SDS存放在buf数组里的数据。
Redisbuf不是用来保存字符,而是用来保存一系列的二进制数据。这也就是我们将SDSbuf属性称为字节数组的原因。

2.2.5 兼容部分C字符串函数

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容