内存管理是C++最令人头痛的问题,也是C++最有争议的地方。C++高手从中获得了更好的性能,更大的自由,C++菜鸟获取的则是一遍一遍的检查代码。而这一切都源于C++内存管理的灵活性,其多样的内存分配方式就是其灵活性的最好例证之一。
一个程序要运行,就必须先将可执行的程序加载到计算机内存里,程序加载完毕后,会形成一个运行空间,并按照下图所示进行布局。
- 代码区:存放的是程序的执行代码;
- 数据区:存放的是全局数据、常量、静态变量等;
- 堆区:存放的是动态内存,供程序随机申请使用;
- 栈区:存放的是程序中所用到的局部数据。
这些数据可以动态地反应程序中对函数的调用状态,通过其轨迹也可以研究其函数机制。其中,除了代码区不是我们能在代码中直接控制的,剩余三块都是我们编码过程中可以利用的。
在C++中,数据区又被分成自由存储区、全局/静态存储区和常量存储区,再加上堆区、栈区,也就是说内存被分成了5个区。这5种不同的分区各有所长,适用于不同的情况。
1.C++的内存分配方式
1.1 栈区
在执行函数时,函数内局部变量的存储单元都可以在栈上创建,函数执行结束时这些存储单元将自动被释放。栈内存分配运算内置于处理器的指令集中,效率很高,但是所分配的内存容量有限。
1.2 堆区
堆是操作系统中的术语,是操作系统所维护的一块特殊内存,用于程序的内存动态分配,C语言使用malloc从堆上分配内存,使用free释放已分配的对应内存。
1.3 自由存储区
自由存储区是C++基于new操作符的一个抽象概念,凡是通过new操作符进行内存申请,该内存即为自由存储区。
那么自由存储区是否能够是堆(问题等价于new是否能在堆上动态分配内存),这取决于operator new 的实现细节。自由存储区不但可以是堆,还可以是静态存储区,这要看operator new在哪里为对象分配内存。具体可以参考C++ 自由存储区是否等价于堆?这篇文章。
1.4 全局/静态存储区
全局变量和静态变量被分配到同一块内存中,在以前的C语言中,全局变量又分为初始化的和未初始化的,在C++里面没有作此区分,它们共同占用同一块内存区。
1.5 常量存储区
比较特殊,里面存放的是常量,不允许修改。
2.堆与栈的区别
上述5种分区中,最常用的就是堆和栈了,最容易混淆的也是它们。所以搞清楚堆和栈的区别是很有必要的。它们的区别主要有以下几个方面
2.1 管理方式
栈是由编译器自动管理的,无须手工控制;堆的释放工作由程序员控制,容易产生内存泄漏。
2.2 空间大小
一般来说在32位系统下,堆内存可以达到4GB(2^32B = 4 * 2^30B = 4GB)的空间,从这个角度来看堆内存几乎是没有什么限制的。但是对于栈来讲,一般都是有一定空间大小的。例如,VS2017默认栈空间大小是1M。
2.3 碎片问题
对堆来讲,频繁的new/delete会造成内存空间的不连续,从而产生大量的碎片,使程序效率降低。对于栈来讲,则不存在这个问题,因为栈是队列,其中的数据必须遵循先进后出的规则,相互之间紧密排列,绝不会留给其他数据可插入之空隙,所以永远都不可能有一个内存块从栈中间弹出。
2.4 生长方向
对于堆来讲,其生长方向是向上的,也就是向着内存地址增加的方向增长;对于栈来讲,它的生长方向是向下的,是向着内存地址减小的方向增长的。
2.5 分配方式
堆都是动态分配的,没有静态分配的堆。栈有两种分配方式:静态分配和动态分配。静态分配是编译器完成的,比如局部变量的分配。动态分配由alloca函数完成,但是栈的动态分配和堆是不同的,它的动态分配是由编译器进行释放的,无须我们手工实现。
2.6 分配效率
栈是系统提供的数据结构,计算机会在底层对栈提供支持:它会分配专门的寄存器存放栈的地址,而且压栈出栈都会有专门的指令来执行,这就决定了栈的效率比较高。堆则是C/C++函数库提供的,它的机制很复杂,例如为了分配一块内存,库函数会按照一定的算法(具体的算法可以参考数据结构/操作系统)在堆内存中搜索可用的足够大小的空间,如果没有足够大小的空间(可能是由于内存碎片太多),则可能调用系统功能去增加程序数据段的内存空间,这样就有机会分到足够大小的内存了,然后返回。显然,堆的效率比栈要低得多。
2.7 总结
堆和栈相比,由于堆使用了大量new/delete,容易造成大量的内存碎片,而且它没有专门的系统支持,效率很低,另外它还可能引发用户态和核心态的切换,以及内存的申请,代价会变得很高。所以栈在程序中是应用最广泛的,就算是函数的调用也会利用栈去完成,函数调用过程中的参数、返回的地址、EBP和局部变量都是采用栈的方式存放的。所以,推荐大家尽量多用栈,而不是用堆。
虽然栈有如此多的好处,但是由于和堆相比它不是那么灵活,有时候会分配大量的内存空间,在遇到这种情况时还是用堆好一些。
3.常见的内存处理规则
【规则1】用malloc或new申请内存之后,应该立即检查指针值是否为NULL。防止使用指针值为NULL的内存。
【规则2】不要忘记为数组和动态内存赋初值。防止将未被初始化的内存作为右值使用。
【规则3】避免数组或指针的下标越界,特别要当心发生“多1”或者“少1”操作。
【规则4】动态内存的申请与释放必须配对,防止内存泄漏。
【规则5】用free或delete释放了内存之后,立即将指针设置为NULL,防止产生“野指针”。
个人主页: