在数据结构中堆和栈都是一种数据项按序排列的数据结构,但我们今天所说的重点并不是数据结构中的堆和栈,而是C语言内存分配中的堆区和栈区。C语言中内存分配的情况是:一般程序放在ROM或者是Flash中,运行时需要拷贝到内存中执行,内存中会在不同的地方存放不同的信息。
堆栈缓存方式
栈使用的是一级缓存, 他们通常都是被调用时处于存储空间中,调用完毕立即释放。
堆则是存放在二级缓存中,生命周期由虚拟机的垃圾回收算法来决定(并不是一旦成为孤儿对象就能被回收)。所以调用这些对象的速度要相对来得低一些。
可编程内存基本上分为几大部分:静态存储区(全局区)、文字常量区(存储字符串常量)、程序代码区(存放二进制程序)、堆区和栈区。
- 静态存储区:内存在程序编译的时候就已经分配好,这块内存在程序的整个运行期间都存在。速度快、不容易出错,因为有系统会善后。主要用来存放静态数据、全局数据和常量。
- 栈区:在执行函数时,函数内局部变量的存储单元都可以在栈上创建,函数执行结束时这些存储单元自动被释放。栈内存的分配运算内置于处理器的指令集当中,效率高,但是内存的容量有限。由OS限制。
- 堆区:使用malloc或new申请任意大小的内存,使用完成以后由程序员手动释放。若不释放,程序将会在最后运行结束后释放掉动态内存。但是,良好的编程习惯是某动态内存不再使用后就将其释放掉,否则就认为发生了内存泄露现象。
在内存中的栈区位于相对较高的地址处,且以地址的增长方向为上的话,栈区的地址是向下增长的。栈中分配局部变量空间。堆区是向上增长的,用于分配程序员申请的空间;另外还有静态区是分配静态变量、全局变量空间的,全局变量和静态变量的存储是放在一起的,初始化的全局变量和静态变量在一个区块,未初始化的全局变量和未初始化的静态变量在相邻的另一个区块,程序结束后由OS释放; 只读区是分配常量和程序代码空间的。
例如:
int a; //全局初始化区 char *p1;//全局未初始化区 main() { int b;//栈 char s[] = "abc"; //栈 char *p2; // 栈 char *p3 = "123456"; //123456\0存储在常量区,而p3在栈上 static int c = 0; //全局(静态)初始化区 p1 = (char *)malloc(10); //堆 p2 = (char *)malloc(20); //堆 }
堆和栈的区别
申请、回收方式不同:栈(stack)是系统自动分配空间的,如定义一个char a;系统自动为其在栈上开辟空间。而堆(heap)则是程序员根据自己的需要申请的空间,如malloc(10);在heap上开辟十个字节的空间。由于栈上的空间是自动分配自动回收的,所以栈上的函数的生存周期就只是在函数的运行过程中,运行之后就被释放掉,无法再次被访问到。而heap上的数据只要程序员不释放空间,就可以一直被访问到,缺点就是一旦忘记释放就会造成内存泄露。
申请后系统的反应: 申请栈时只要栈的剩余空间大于所申请的空间,系统将为程序提供内存,否则将会提示栈溢出。而对于堆操作系统会维护有一个记录空闲内存地址的链表,当系统收到程序的申请时,会遍历该链表,寻找第一个空间大于所申请空间的堆。然后将该节点从空闲链表中删除,并将该节点的空间分配给程序,另外,对于大多数的系统,会在这块内存空间中的首地址处记录本次分配的大小,这样就能在释放的时候正确的释放空间。另外,由于找到的堆节点的大小不一定正好等于申请的大小,系统会自动的将多余的那部分重新放入空闲链表当中。也就是说heap在申请之后还要做一些后续的工作,这样就会引出效率的问题。
申请大小的限制: 在WINDOWS中,栈是向低地址扩展的数据结构,是一块连续的内存区域,即栈顶的地址和栈的最大容量是系统预先规定好的。若申请的空间超过栈的剩余空间,将会提示overflow。heap是向高地址扩展的数据结构,是不连续的内存区域,这是由于系统使用链表来存储空闲内存地址。链表的遍历方向是由低地址向高地址的。堆的大小受限于计算机系统中有效的虚拟内存。由此可见,堆获得空间的灵活性较大。
存储内容:对于stack的存储,在函数调用时,第一个进栈的是主函数中函数调用后的下一条指令(函数调用语句的下一条可执行语句)的地址,然后是函数的各个参数,在大多数的C编译器中,参数是由右往左入栈的,然后是函数中的局部变量。在本次的函数调用完成以后,局部变量先出栈,然后是参数,最后栈顶指针指向最开始存的地址,也就是函数中的下一条指令,程序由该点继续运行。 对于heap的存储,一般是在heap的头部使用一个字节存放heap的大小,heap中的具体内容则由程序员来安排。
碎片问题:对于堆来讲,频繁的new/delete势必会造成内存空间的不连续,从而造成大量的碎片,使程序效率降低。对于栈而言就不存在这个问题。
分配效率:栈是机器系统提供的数据结构,计算机会在底层对栈提供支持--分配专门的寄存器存放栈地址,压栈出栈都有专门的指令执行,这就决定了栈的效率比较高。堆则是由C/C++函数库提供的,机制复杂。堆的效率比栈要低的多。
栈在程序中应用是最广泛的,就算是函数的调用也是利用栈来完成的,函数调用过程中的参数,返回地址,EBP和局部变量都采用栈的方式存放。如果少量的数据需要频繁的操作,那么在程序中动态申请少量的栈内存(例如alloca函数),会获得很好的性能提升。与堆相比,栈的使用不是那么灵活,如果分配大量的内存空间,推荐使用堆内存。