1. C/C++语言内存分布
一个C/C++编译的程序所占用的系统内存一般分为以下几个部分的内容:
1) 字符起始区块(Blocks Started by Symbol segment,BSS segment)
通常是指用来存放程序中未初始化的全局变量或静态变量的一块内存区域。BSS段属于静态内存分配。
2) 数据段(data segment)
通常是指用来存放程序中已初始化的全局变量的一块内存区域。数据段属于静态内存分配。
3) 代码段(code segment/text segment)
通常是指用来存放程序执行代码的一块内存区域。这部分区域的大小在程序运行前就已经确定,并且内存区域通常属于只读, 某些架构也允许代码段为可写,即允许修改程序。在代码段中,也有可能包含一些只读的常数变量,例如字符串常量等。
4) 堆(heap)
堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc/free等函数分配内存时,新分配的内存就被动态添加到堆上,堆被扩张,当进程调用free/malloc则被释放的内存从堆中被剔除,堆被缩减。堆向高地址方向生长。
堆一般由程序临时创建和释放,若程序员不释放,程序结束时,可能由操作系统回收。
5) 栈(stack)
栈又称堆栈, 存放程序的局部变量(但不包括static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,栈用来传递参数和返回值。由于栈的后进先出特点,所以栈特别方便用来保存/恢复调用现场。栈向低地址方向生长。
2. 什么是内存泄漏
堆是动态分配内存的,并且可以分配使用很大的内存,使用不好会产生内存泄漏。频繁地使用malloc和free会产生内存碎片。(类似磁盘碎片)
内存泄漏(memory leak)指的是由于疏忽或错误造成程序未能释放已经不在使用的内存的情况。一般,内存泄漏指的是堆内存泄漏,是由于设计错误,失去了堆该段内存的控制,因为造成了内存的浪费,程序运行速度减慢甚至系统崩溃等严重后果。
应用程序一般使用malloc,calloc,realloc,new来从堆中申请一块内存,使用结束以后,一定要使用free或delete释放内存。
3. 栈空间大小
在Windows下,栈是由向低地址扩展的数据结构,是一块连续的内存的区域,栈顶的地址和栈的最大容量是系统预先规定好的。
在Windows下,栈的默认大小一般是1M到2M。如果用的VS可以在设置里指定Stack Reserve大小,默认是1MB。Linux中,可以通过命令 ulimit -s 查看和设置linux的默认栈空间大小,默认情况下 为10240 即10M。
栈的速度快,但是空间小,不灵活。由于内存的读取速度比硬盘快,当程序遇见大规模数据的频繁存取时,开辟内存空间很有作用。
堆是向高地址扩展的数据结构,是不连续的内存区域。这是由于系统是用链表来存储空闲地址,自然是不连续的。链表的遍历方向是由低地址向高地址的,堆的大小同时也收到系统中虚拟内存的限制。总体而言堆内存使用较为灵活,但速度相对慢一些。
4. 什么是缓冲区溢出
缓冲区是程序运行时,内存中的一个连续块,它保存了给定类型的数据,随着动态分配变量,可能会出现问题。
缓冲区溢出是指当前向缓冲区填充的数据位数超过了缓冲区自身容量的上限。
在计算机安全领域,缓冲区溢出就好比给自己的程序开了个后门,这种安全隐患是致命的。缓冲区溢出在各种操作系统、应用软件中广泛存在。而利用缓冲区溢出漏洞实施的攻击就是缓冲区溢出攻击。缓冲区溢出攻击,可以导致程序运行失败、系统关机、重新启动,或者执行攻击者的指令,比如非法提升权限。
在当前网络与分布式系统安全中,被广泛利用的50%以上都是缓冲区溢出,其中最著名的例子是1988年利用fingerd漏洞的蠕虫。而缓冲区溢出中,最为危险的是堆栈溢出,因为入侵者可以利用堆栈溢出,在函数返回时改变返回程序的地址,让其跳转到任意地址,带来的危害一种是程序崩溃导致拒绝服务,另外一种就是跳转并且执行一段恶意代码,比如得到shell,然后为所欲为。