C# unsafe code

指针和地址

有时，开发人员希望直接访问和操纵内存，以及直接用指针来定位内存。这对特定的操作系统交互以及某些对时间敏感的算法来说是必要的。为了提供这方面的支持，c#要求使用“不安全的代码”结构。

1，不安全的代码

c#的一个突出优点在于它是强类型的，而且支持运行时的类型检查。然而，仍然可以绕过这个机制，直接操纵内存和地址。例如，在操作内存映射设备时，或者想要实现一个对时间敏感的算法时，就需要这样做。为此，只需将代码区域指定为unsafe。

不安全的代码是一个显式的代码块和编译选项，unsafe修饰符对生成的CIL代码本身没有影响。它仅仅是一个预编译指令，作用是向编译器指出允许在不安全的代码块操纵指针和地址。此外，不安全并不意味着非托管。

unsafe

可将unsafe用作类型或类型内部的特定成员的修饰符。除此以外，c#允许用unsafe标记代码块，指出其中允许不安全的代码，如：

unsafe块

2，指针的声明

代码块标记为unsafe之后，接着要知道如何写不安全的代码。首先，不安全的代码允许声明指针。如：byte* pData; 假设pData不为null,那么它的值指向的是包含一个或多个连续字节的内存位置，pData的值代表这些字节的内存地址。符号*之前指定的类型是被引用物（referent）的类型，或者说是指针指向的那个位置存储的值的类型。在本例中，pData是指针，而byte是被引用物类型。

由于指针恰好是指向内存地址的整数，所以不会被垃圾回收。C#不允许非托管类型以外的被引用物类型。换言之，不能是引用类型，不能是泛型类型，而且内部不能包含引用类型。所以，以下声明是无效的：

string* pMessage;

指针包含的只是实际数据所在的地址

以下声明也不正确：

ServiceStatus* pStatus;

其中，ServiceStatus的定义如下：问题仍然是ServiceStatus中包含了一个string字段。

除了只包含非托管类型的自定义结构，有效的被引用物类型还包括枚举，预定义值类型（sbyte, byte, short, ushort, int, uint, long, ulong, char, flaot, double, decimal和bool）以及指针类型（如byte**）. void*指针也是有效的，它代表指向未知类型的指针。

3，指针的赋值

代码定义好指针后，在访问它之前必须为它赋值。就像其他引用类型一样，指针可以包含null值，这也是它们的默认值。指针保存的是一个位置的地址。因此，对指针进行赋值，首先必须获取数据的地址。可以显式将一个int或long转换为指针。但是，除非有办法在执行时获得一个特定的数据值的地址，否则很少能够这样做。相反，需要使用地址操作符（&）来获取值类型的地址，如下：

byte * pData = &bytes[0]; //编译错误

问题在于托管环境中数据可能发生移动，因而导致地址无效。本倒中，被引用的字节出现在一个数据内，而数组是引入类型（在内存中可能移动的类型）。引用类型出现在内存堆（heap)上，可以被垃圾或者重新分配。对一个可移动类型中的值类型字段进行引用，会了生类似错误： int* a = &"message".Length;

无论哪种方式，为了将数据的地址赋给指针，要求如下：

数据必须属于一个变量。

数据必须是非托管类型。

变量需要用fixed固定，不能移动。

如果数据是一个非托管变量类型，但是不固定，就使用固定语句固定可移动的变量。

3.1 固定数据

要获得可移动数据项的地址，首先必须把它固定下来：

fixed

fixed语句要求在其作用域内声明指针变量。这样可以防止数据不再固定时访问到fixed语句外的变量。由于string是无效的被引用物类型，所以定义string指针似乎是无效的。然而，和c++一样，在内部，string本质上就是指针，它指向字符数组的第一个字符。而且可以使用char*来声明字符指针。因此，c#允许在fixed语句中声明char*类型的指针，并可以把它赋给一个string。 fixed语句防止字符串在指针生存期内移动。

可以使用缩写的bytes来取代冗长的&bytes[0]赋值

没有地址或数组索引的固定语句

取决于执行频率和执行时机，固定语句可能会导致内存堆中出现碎片，这是由于垃圾回收器不能压缩已固定的对象。

3.1 在栈上分配

应该为一个数组使用fixed语句，防止垃圾回收器移动数据。然而，别一种做法是在调用栈上分配数组。栈分配的数据不会被垃圾回收，也不会被终结器清理。和引用类型一样，要求stackalloc(栈分配)数据是非托管类型的数组。例如，可以不在堆上分配一个byte数组，而是把它放在调用栈上：

byte* bytes = stackalloc byte[42];

由于数据类型是非托管类型的数组，所以“运行时”可以为该数组分配一个固定大小的缓冲区，并在指针越界的时候回收该缓冲区。具体会分配 sizeof(T) * E, E是数组大小，T是引用类型。由于只能为非托管类型的数组使用stackalloc,所以运行时为了回收缓冲区并把它返还给系统，只需对栈执行一次展开，从而避免了遍历f-reachable队列并对reachable数据进行压缩的复杂性。因此，没有办法显示地释放stackalloc数据。

4，指针的解引用

为了访问指针引用的一个类型的值，需要解引用指针，即在指针类型之前添加一个间接寻址操作符*。例如，语句 byte data = *pData; 的作用是解引用pData引用的byte所在的位置，并返回那个位置上的一个byte。

在不安全的代码中这样做会使本来“不可变”的字符串变得可以被修改：

输出：

不能对void*类型的指针应用解引用操作符。void* 数据类型代表的是指向一个未知类型的指针。为了访问void*引用的数据，必须把它转换成其他任何类型的变量，然后进行解引用。

可以使用索引操作符而不是间接寻址来修改固定字符串：

5. 访问被引用物类型的成员

指针解引用将生成指针基础类型的变量。然后可以使用成员访问（点）操作符来访问基础类型成员。然而，根据操作符优先级规则， *x.y等价于*（x.y）,而这可能不是你所希望的。如果x是一个指针，正确代码是（*x）.y. ,为了更容易地访问解引用的指针的成员，c#提供了特殊的成员访问修饰符：x->y 是（*x）.y和简化形式。

6.通过委托执行不安全的代码

C# unsafe code

推荐阅读更多精彩内容