指针和地址
有时,开发人员希望直接访问和操纵内存,以及直接用指针来定位内存。这对特定的操作系统交互以及某些对时间敏感的算法来说是必要的。为了提供这方面的支持,c#要求使用“不安全的代码”结构。
1,不安全的代码
c#的一个突出优点在于它是强类型的,而且支持运行时的类型检查。然而,仍然可以绕过这个机制,直接操纵内存和地址。例如,在操作内存映射设备时,或者想要实现一个对时间敏感的算法时,就需要这样做。为此,只需将代码区域指定为unsafe。
不安全的代码是一个显式的代码块和编译选项,unsafe修饰符对生成的CIL代码本身没有影响。它仅仅是一个预编译指令,作用是向编译器指出允许在不安全的代码块操纵指针和地址。此外,不安全并不意味着非托管。
可将unsafe用作类型或类型内部的特定成员的修饰符。除此以外,c#允许用unsafe标记代码块,指出其中允许不安全的代码,如:
2,指针的声明
代码块标记为unsafe之后,接着要知道如何写不安全的代码。首先,不安全的代码允许声明指针。如:byte* pData; 假设pData不为null,那么它的值指向的是包含一个或多个连续字节的内存位置,pData的值代表这些字节的内存地址。符号*之前指定的类型是被引用物(referent)的类型,或者说是指针指向的那个位置存储的值的类型。在本例中,pData是指针,而byte是被引用物类型。
由于指针恰好是指向内存地址的整数,所以不会被垃圾回收。C#不允许非托管类型以外的被引用物类型。换言之,不能是引用类型,不能是泛型类型,而且内部不能包含引用类型。所以,以下声明是无效的:
string* pMessage;
以下声明也不正确:
ServiceStatus* pStatus;
其中,ServiceStatus的定义如下:问题仍然是ServiceStatus中包含了一个string字段。
除了只包含非托管类型的自定义结构,有效的被引用物类型还包括枚举,预定义值类型(sbyte, byte, short, ushort, int, uint, long, ulong, char, flaot, double, decimal和bool) 以及指针类型(如byte**). void*指针也是有效的,它代表指向未知类型的指针 。
3,指针的赋值
代码定义好指针后,在访问它之前必须为它赋值。就像其他引用类型一样,指针可以包含null值,这也是它们的默认值。指针保存的是一个位置的地址。因此,对指针进行赋值,首先必须获取数据的地址。可以显式将一个int或long转换为指针 。但是,除非有办法在执行时获得一个特定的数据值的地址,否则很少能够这样做。相反,需要使用地址操作符(&)来获取值类型的地址,如下 :
byte * pData = &bytes[0]; //编译错误
问题在于托管环境中数据可能发生移动,因而导致地址无效。本倒中,被引用的字节出现在一个数据内,而数组是引入类型(在内存中可能移动的类型)。引用类型出现在内存堆(heap)上,可以被垃圾或者重新分配。对一个可移动 类型中的值类型字段进行引用,会了生类似 错误: int* a = &"message".Length;
无论哪种方式,为了将数据的地址赋给指针,要求如下:
数据必须属于一个变量。
数据必须是非托管类型。
变量需要用fixed固定,不能移动。
如果数据是一个非托管变量类型,但是不固定,就使用固定语句固定可移动的变量。
3.1 固定数据
要获得可移动数据项的地址,首先必须把它固定下来:
fixed语句要求在其作用域内声明指针变量。这样可以防止数据不再固定时访问到fixed语句外的变量。 由于string是无效的被引用物类型,所以定义string指针似乎是无效 的。然而,和c++一样,在内部,string本质上就是指针,它指向字符数组的第一个字符。而且可以使用char*来声明字符指针。因此,c#允许在fixed语句中声明char*类型的指针,并可以把它赋给一个string。 fixed语句防止字符串在指针生存期内移动。
可以使用缩写的bytes来取代冗长的&bytes[0]赋值
取决于执行频率和执行时机,固定语句可能会导致内存堆中出现碎片,这是由于垃圾回收器不能压缩已固定的对象。
3.1 在栈上分配
应该为一个数组使用fixed语句,防止垃圾回收器移动数据。然而,别一种做法是在调用栈上分配数组。栈分配的数据不会被垃圾回收,也不会被终结器清理。和引用类型一样,要求stackalloc(栈分配)数据是非托管类型的数组。例如,可以不在堆上分配一个byte数组,而是把它放在调用栈上:
byte* bytes = stackalloc byte[42];
由于数据类型是非托管类型的数组,所以“运行时”可以为该数组分配一个固定大小的缓冲区,并在指针越界的时候回收该缓冲区。具体会分配 sizeof(T) * E, E是数组大小,T是引用类型。由于只能为非托管类型的数组使用stackalloc,所以运行时为了回收缓冲区并把它返还给系统,只需对栈执行一次展开,从而避免了遍历f-reachable队列并对reachable数据进行压缩的复杂性。因此,没有办法显示地释放stackalloc数据。
4,指针的解引用
为了访问指针引用的一个类型的值,需要解引用指针,即在指针类型之前添加一个间接寻址操作符*。 例如,语句 byte data = *pData; 的作用是解引用pData引用的byte所在的位置,并返回那个位置上的一个byte。
在不安全的代码中这样做会使本来“不可变”的字符串变得可以被修改:
输出 :
不能对void*类型的指针应用解引用操作符。void* 数据类型代表的是指向一个未知类型的指针。为了访问void*引用的数据,必须把它转换成其他任何类型的变量,然后进行解引用。
可以使用索引操作符而不是间接寻址来修改固定字符串:
5. 访问被引用物类型的成员
指针解引用将生成指针基础类型的变量。然后可以使用成员 访问(点)操作符来访问基础类型成员。然而,根据操作符优先级规则, *x.y等价于*(x.y),而这可能不是你所希望的。如果x是一个指针,正确代码是 (*x).y. ,为了更容易地访问解引用的指针的成员,c#提供了特殊的成员 访问修饰符:x->y 是(*x).y和简化形式。
6.通过委托执行不安全的代码