在讨论rust的所有权和引用的时候,我们遗漏了一个重要细节,即:Rust的每一个引用都有其生命周期(lifetime),也就是引用保持有效的作用域。
一、悬垂引用
我们在说到所有权的时候,曾经讨论过悬垂引用/指针。悬垂指针:指针所指向的对象已经被释放或者回收了,但是指向该对象的指针没有作任何的修改,仍旧指向已经回收的内存地址。 此类指针称为垂悬指针。
这在c/c++中是个常见的困扰程序员的问题,rust的所有权系统,一定程度上避免了因为使用了多个指向同一堆内存的指针而导致的悬垂引用。但是要从根本上解决悬垂引用的问题,得涉及到rust的生命周期机制。
有如下代码:
首先我们声明了一个未初始化的变量x,然后在大括号内把x的引用绑定到了r上。可以发现代码提示有错误。运行时报错如下:
这是因为x指向的内存在走出大括号后就被释放了,而下一句还要打印r的内容,自然就会有悬垂引用的错误。
那么rust是如何知道代码不合法的呢?这里rust编译器使用了借用检查器来检查出问题。
二、借用检查器与生命周期
1、借用检查器
借用检查器是通过比较作用域来判断所有的借用是否合法。
rust在编译的时候就会比较r和x两个生命周期的长短,它发现被引用者x的生命周期短于引用者的生命周期r。于是就报错了。只需要把x的生命周期设置得比r更长,就没有问题了。如下所示:
2、生命周期
语法如下:
示例如下:
三、函数与生命周期
1、函数签名中的生命周期
我们要写一个函数,实现的功能很简单,就是返回两串字符串中较长的那个,示例如下:
按照编程经验,我们写了上面的代码。两个形参都是字符串的引用,返回一个字符串的引用。报错信息如下:
错误信息告诉我们,函数缺少生命周期的标注,返回类型这块缺少一个命名的生命周期参数。
仔细看这个函数内容会发现,传入两个字符串切片x和y,较长的那个不是x就是y,而x和y具体的生命周期我们也是不知道的,所以也没法跟之前的例子一样通过比较生命周期域从而判断返回的引用是否是一直有效的。借用检查器也是做不到的,就是因为不知道返回的&str的生命周期到底是跟x还是跟y有关系。
下面,如果把逻辑改成确定的逻辑,就是返回x,看看是否报错:
发现还是发生了错误,报的是跟之前一样的错误。所以这个错误跟函数体内的逻辑没有关系,还是跟函数签名有关。
根据编译器的提示,我们修改函数签名如下:
这里传入的两个引用形参和返回的引用都有着相同的生命周期(语法形式上相同)。
当函数在外边被调用,具体的引用(即实参)被传递给longest函数后,泛型生命周期'a所替代的具体生命周期是x和y之中生命周期较小的那一个。那也就意味着,我们返回的引用值,在x和y中较短的那个生命周期结束之前都是保持有效的。这样就避免了悬垂引用。
此例中若只返回x,那么就可以在形参中把y的生命周期去掉,如下:
2、函数中的悬垂引用
如下示例:
longest返回的是引用类型result.as_str(),但是该引用在函数体结束后其堆内存就被释放了,此时返回的引用就变成了悬垂引用。当main函数中println!用到这块堆内存时,就出错了。
这个时候我们不能返回引用,返回result值就可以了。这就相当于把所有权移交给函数的调用者了。
四、结构体与生命周期
结构体struct中,可以包括自持有的类型和引用类型。值得注意的是,引用类型必须要添加生命周期标注。
有示例如下:
这个结构体定义,意味着part这个引用必须要比结构体实例存活的要长。因为只有实例存在的话,就会一直有个part引用,如果part先被释放内存了,肯定会出现悬垂引用,内存又会不安全。
main函数中可以看出,first_sentense这个引用的生命周期行数为8-15,而结构体实例i的生命周期行数为行数12-15,引用存活时间要比实例长,所以这段代码是没有问题的。
五、生命周期的省略
输入生命周期:函数或方法的参数的生命周期。
输出生命周期:返回值的生命周期。
当编译器用完了所有生命周期规则之后,仍然无法确定函数签名中所有的生命周期,就会报错。
六、方法定义与生命周期
在struct上使用生命周期实现方法,语法和泛型参数的语法一样。
其中生命周期省略的规则三,就是针对方法中的引用的。
如上图,根据省略规则1,我们可以不为第5行的&self标注生命周期,再根据规则3,可以推导出方法定义中所有的生命周期。整段代码也就可以正常编译运行了。
七、静态生命周期
'static
是一个特殊的生命周期,它代表整个程序的持续时间。
例如,所有的字符串字面值都拥有'static生命周期。因为字符串字面值是直接存储在二进制程序当中,所以它总是可用的。
而在我们给引用指定static的生命周期时,就要思考清楚是否需要在程序整个生命周期内都要存活,否则容易引起内存安全问题。