14:内存管理
14.1:内存分类与寻址
14.1.1:内存分类
在C程序中,能存放数据的地方包括:
- 静态区:存储全局变量,静态局部变量以及常量字符串;常量字符串存储在.rdata;初始化的全部变量、初始化的全局静态变量及初始化的静态局部变量存储在.data;未初始化的全部变量、未始化的全局静态变量及未初始化的全局静态变量存放在.bss
- 栈:存储函数内的局部变量
- 堆:存储通过malloc()函数分配的变量
代码区(code):.text 代码段,这个存放代码的,用汇编角度来看就是指令。
14.1.2:堆栈区别
栈 | 堆 | |
---|---|---|
内存分配 | 由系统自动分配与回收,地址增长方向由高到底 | malloc分配,free释放,地址增长方向由低到高 |
大小限制 | Windows在应用层的栈大小为1M,而Linux在应用层的大小为10M;内核层12K到24K不等,所以在内核层开发时候不能使用递归 | 受限于计算机系统中有效的虚拟内存 |
执行效率 | 系统自动分配,速度快,开发者无法控制 | 速度比较慢,平凡分配回收,容易产生内存碎片(开发者可以通过程序减少内存碎片的产生) |
存放内容 | 记录程序执行中函数调用过程中的活动(栈帧),存放参数、返回地址(eip)、ebp、局部变量等 | 一般是在堆头部用一个字节存放堆大小,剩余部分存储的内容由开发者根据程序计算的需要决定 |
14.1.3:内存地址分类和寻址模式
程序的内存寻址是一个重要的概念。
内存地址可以分为逻辑地址,线性地址和物理地址
内存地址分类 | 定义 | 组成转化 |
---|---|---|
逻辑地址 | 是编译器生成的,使用C语言指针时,指针的值就是逻辑地址(及printf打印的地址即逻辑地址);对于每个进程他们有一样的进程地址空间,类似的逻辑地址,甚至可能相同 | 有段地址+段内偏移主城 |
线性地址 | 由分段机制将逻辑地址转化而来,如果没有分段机制作用,那么程序的逻辑地址就是线性地址了。 | |
物理地址 | CPU在地址总线上发出的电平信号,要得到物理地址,必须要将逻辑地址经过分段,分页等机制转化而来。 |
从逻辑地址到物理地址的翻译过程叫寻址。x86体系结构下,使用最多的内存寻址模型主要有2种:
- 实模式分段模型(real mode segment model)
- 保护模式平坦模型(protected mode flat model)
介绍内存寻址模型首先要了解内存的寻址模式
内存寻址模型 | 定义 |
---|---|
分段模型 | 在早期16位系统中,地址总线占20位支持220=1M的寻址空间,16位的寄存器却只能表示216=64KB的空间,于是8086CPU将1MB的存储空间分成许多逻辑段,每个段最大限制为64KB(为了能让16位寄存器寻址,220=216*2^4=16*64K),段地址()就是逻辑段在主存中的起始位置。每个段地址其实还是20位,为了能用16位寄存器表示段地址,8086规定段地址必须是模16地址,即为xxxx0H形式,省略低4位0,段地址就可以用16位数据表示,它通常被保存在16位的段寄存器中。存单元距离段起始位置的偏移量简称偏移地址,由于限定每段不超过64KB,所以偏移地址也可以用16位数据表示。 物理地址:在1M字节的存储器里,每一个存储单元都有一个唯一的20位地址,称为该存储单元的物理地址,把段地址左移4位(因为段地址低4位都是零)再加上偏移地址就形成物理地址。 Seg<<4+Offset(左移4位相当于2^4) 对于 8086/8088 运行在实模式的程序,其实就是运行在实模式分段模型中。对于不同的程序,有不同的CS,DS值,每个程序的段起始地址都不同。对于这样的程序而言,偏移地址16位的特性决定了每个段只有64KB大小。 (这紧紧是在16位系统中) |
扁平模型 | 在32/64位系统,地址总线和寄存器都是32/64位,这种情况下一个寄存器和指令可以寻址整个线性地址空间。不需要使用基地址,不需要切换CS,DS,基址可以设为一个统一的值。 Linux, Window XP/7采用的内存寻址模型,Linux中,段主要分为4种,即为内核代码段,内核数据段,用户代码段,用户数据段。对于内核代码段和数据段而言,CS,DS的值是0xC00000000,而用户代码和数据段的CS,DS的值是0x00000000。 |
实模式 | 实模式运行于20位地址总线,寻址空间1M,16位的寄存器无法表示,因此段被分成64KB,1M分为16个64KB,CS、DS等存储的是段的起始地址通过CS<<4+IP进行寻址(一个基址寄存器+一个段寄存器联合起来则可以表示更大的一个地址空间。于是发明了这种段寄存器左移4位+基址寄存器用以间接寻址。) |
保护模式 | 启用了32位总线,地址使用的是虚拟地址,引入了页表和段描述符表,用GDT和LDT段描述符表的数据结构来定义每个段,通过页表等进行寻址 |
保护模式虚拟地址到物理地址寻址
逻辑地址=》线性地址(32位或者64位系统(64位太大,一般用44、48位))==》物理地址
如:x64中使用低48位,每级页表占9位,共4级,缩写分为PML4,PDP,PD,PT
x86二级寻址
x64四级寻址
14.2:内存分配
内存分配,分为两种:
- 在栈上分配内存;
- 在堆上分配;
14.2.1:栈上分配
在函数内部定义局部变量,就是在栈上分配内存。占内存大小是有限制的,不能超过栈的大小,否则会造成栈的溢出。栈上分配的内存系统会在函数运行结束后自动回收。
void func() {
int Number[1024]={0};//Number数组从栈上分配内存
}
Windows在应用层的栈大小为1M,而Linux在应用层的大小为10M。
14.2.2:堆上分配
堆上的内存:malloc()函数分配的内存;free()函数释放内存;系统不会自动回收,需开发者手动释放;free之后一定置NULL。
int *p=(int *)malloc(10*sizeof(int));
free(p);
//当调用free()把p所指堆上的内存释放(回收)之后,p指向了一个无效内存地址,成为了野指针,所以需要重新将p置为NULL,如下:
p=NULL;
14.2.2.1:malloc/calloc/realloc
void *malloc(unsigned int num_bytes);
void *calloc(size_t n, size_t size);//元素格式,长度
void *realloc(void *mem_address, unsigned int newsize);
/*
malloc:分配内存,空间不初始化为零;失败返回NULL,成功返回内存地址,内存中位垃圾值,需要清零free
calloc:在内存的动态存储区中分配n个长度为size的连续空间,函数返回一个指向分配起始地址的指针,内存空间初始化为0.
realloc:先判断当前的指针是否有足够的连续空间,如果有,扩大mem_address指向的地址,并且将mem_address返回,如果空间不够,先按照newsize指定的大小分配空间,将原有数据从头到尾拷贝到新分配的内存区域,而后释放原来mem_address所指内存区域(注意:原来指针是自动释放,不需要使用free),同时返回新分配的内存区域的首地址。即重新分配存储器块的地址。
14.2.3:静态区分配
静态区分配:全局变量或者静态局部变量的内存空间
//定义如下的全局变量:
int g_iNumber[1024]={0};
//则g_iNumber就是在静态区获取内存。静态区获取的内存不需要自己释放,系统会在程序退出的时候自动回收。
14.3:内存泄露与检测
内存泄露:从堆上分配内存,如果不注意释放,就会产生内存泄漏
- malloc/free;new/delete要配对出现;写完分配马上写释放。
- goto语句防止内存泄露
- 谁分配谁释放,不要分离
goto语句防止内存泄露
NTSTATUS QueryObjectName(HANDLE h) {
int ret;
NTSTATUS st;
char *str = "Hello, how are u?";
char *pstr = (char *)malloc(256);
if (pstr == NULL) {
printf("No more memory\n");
goto Error;
}
strncpy(pstr, str, strlen(str));
pstr[strlen(str)] = '\0';
char *namebuf = (char *)malloc(1024);
if (buf == NULL) {
printf("No more memory\n");
goto Error;
}
st = NtQueryObject(h, FileNameInformation, namebuf, ret, NULL);
if (!NT_SUCCESS(st)) {
printf("No more memory\n");
goto Error;
}
Error:
//发生错误后,统一处理内存释放问题
if (buf) {
free(buf);
}
if (pstr) {
free(pstr);
}
return st;
}
谁分配谁释放,不要分离
char *func() {
char *p = malloc(128);
return p
}
void func1() {
char *p = malloc(128);
free(p);
p = NULL;
return;
}