内存管理子系统是操作系统中最重要的部分之一。
1、地址类型
物理地址:指出现在CPU外部地址总线上的寻址物理内存的地址信号,是地址变换的最终结果,是内存中实实在在存在的硬件地址。
逻辑地址:程序代码经过编译后在汇编程序中使用的地址,C/C++程序中取地址求出来的地址就是逻辑地址。
虚拟地址(线性地址):在32位CPU架构下,可以表示4G的地址空间,用16进制表示就是0x00000000到0xffffffff。只有启动分页机制的时候才有线性地址,如果没有分页机制,那么线性地址就是物理地址。
2、地址转换
CPU要将一个逻辑地址转换为物理地址,需要两步:首先CPU利用段式内存管理单元,将逻辑地址转换成虚拟地址,再利用页式内存管理单元,把虚拟地址最终转换为物理地址。
即MMU(内存控制单元)通过分段单元把一个逻辑地址转为线性地址,接着通过分页单元把线性地址转为物理地址。
3、段式管理
(1)16位cpu的段式管理
16位CPU内部拥有20位的地址线,它的寻址范围就是2的20次方,也就是1M的内存空间。但是16位CPU用于存放地址的寄存器(IP,SP……)只有16位,因此只能访问65536个存储单元,64K。
为了能够访问1M的内存空间,CPU就采用了内存分段的管理模式,并在CPU内部加入了段寄存器。16位CPU把1M内存空间分为若干个逻辑段,每个逻辑段的要求如下:
a、逻辑段的起始地址(段地址)必须是16的倍数,即最后4个二进制位必须全为0。
b、逻辑段的最大容量为64K。
段寄存器---->
段寄存器是为了对内存进行分段管理而增加的,16位CPU有四个段寄存器,程序可同时访问四个不同含义的段。
1)CS+IP:用于代码段的访问,CS指向存放程序的段基址,IP指向下条要执行的指令在CS段的偏移量,用这两个寄存器就可以得到一个内存物理地址,该地址存放着一条要执行的指令。
2)SS+SP:用于堆栈段的访问,SS指向堆栈段的基地址,SP指向栈顶,可以通过SS和SP两个寄存器直接访问栈顶单元的内存物理位置。
3)DS+BX:用于数据段的访问。DS中的值左移四位得到数据段起始地址,再加上BX中的偏移量,得到一个存储单元的物理地址。
4)ES+BX:用于附加段的访问。ES中的值左移四位得到附加段起始地,再加上BX中的偏移量,得到一个存储单元的物理地址。
物理地址的形成方式--->
由于段地址必须是16的倍数,所以值的一般形式为XXXX0H,即前16位二进制位是变化的,后四位是固定的0,鉴于段地址的这种特性,可以只保存前16位二进制位来保存整个段基地址,所以每次使用时要用段寄存器左移补4个0(乘以16)来得到实际的段地址。
在确定了某个存储单元所属的段后,只是知道了该存储单元所属的范围(段地址->段地址+65536),如果想确定该内存单元的具体位置,还必须知道该单元在段内的偏移。有了段地址和偏移量,就可以唯一的确定内存单元在存储器中的具体位置。
而,逻辑地址=段内偏移量
所以,由逻辑地址得到物理地址的公式为:PA=段寄存器的值*16+逻辑地址
(2)32位cpu的段式管理
32位pc的内存管理依然采用“分段”的管理模式,物理地址同样由段地址和偏移量组成。但既然分为32位和16位,就肯定有不同之处,32位pc采用了两种不同的工作方式:实模式和保护模式。
1)实模式
在实模式下,32位CPU的内存管理与16位CPU是一致的。最大寻址空间1MB,最大分段64KB。
2)保护模式
段基地址长达32位,每个段的最大容量可达4G,段寄存器的值是段地址的“选择器”(Selector),用该“选择器”从内存中得到一个32位的段地址,存
储单元的物理地址就是该段地址加上段内偏移量。
3、分页管理
线性地址被分为固定长度的组,称为页。例如,32位的机器,线性地址最大可为4G,如果用4kb为一个页来划分,这样整个线性地址就被划分为2的20次方个页。
分页单元把所有的物理内存也划分为固定长度的管理单位,它的长度一般与线性地址页是相同的。
如上图所示,每一个32位的线性地址被划分为3部分:页目录索引(10位)、页表索引(10位)、偏移(12位)。
分页管理的步骤---->
1)装入进程的页目录地址(操作系统在调度进程时,把这个地址装入CR3)
2)根据线性地址的前十位,在页目录中,找到对应的索引项,页目录中的项是一个页表的地址
3)根据线性地址的中间十位,在页表中找到页的起始地址
4)将页的起始地址与线性地址与线性地址的最后12位相加,得到物理地址
4、linux页式管理
Linux操作系统采用虚拟内存管理技术,使得每个进程都有独立的进程地址空间,该空间是大小为3G,用户看到和接触的都是虚拟地址,无法看到实际的物理地址。利用这种虚拟地址不但能起到保护操作系统的作用,而且更重要的是用户程序可使用比实际物理内存更大的地址空间。
Linux将4G的虚拟地址空间划分为两个部分——用户空间与内核空间。用户进程通常情况下只能访问用户空间的虚拟地址,不能访问内核空间。例外情况是用户进程通过系统调用访问内核空间。
如上图展示了一个Linux进程的地址空间的组织结构,对于32位进程来说,代码段从地址0x08048000开始;对于64位进程来说,代码段从0x00400000开始。
关于上图堆和栈的区别--->
stack:由系统自动分配,地址增长方向是从高到低。第一个进栈的是主函数中的下一条指令(函数调用语句的下一条可执行语句)的地址,然后是函数的各个参数(以从右往左的方式入栈),然后是函数中的局部变量
heap:需要程序员自己申请,并指明大小。以链表的形式进行管理,地址增长方向是从低到高。
char *p1 = (char *)malloc(10);//c语言申请堆的方式
char *p2 = new char(10);//在c++中申请堆的方式
注:p1 p2本身在栈中,而分配的10字节则在堆区。
注:关于栈是向低地址增长,而堆向高地址增长,这样设计可以使得堆和栈可以充分地利用空闲的地址空间
程序执行时的内存分配情况 -->
int a = 0; //a 在全局已初始化数据区
char *p1; //p1 在 BSS 区(未初始化全局变量)
main()
{
int b; //b 在栈区
char s[] = "abc";
//s 为数组变量,存储在栈区, //“abc”为字符串常量,存储在.rodata常量字符串区
char *p1,p2; //p1、p2 在栈区
char *p3 = "123456"; //123456\0 在.rodata常量字符串区,p3 在栈区
static int c =0; //c为局部静态数据,data数据区
p1 = (char *)malloc(10); //分配得来的 10 个字节的区域在堆区
p2 = (char *)malloc(20); //分配得来的 20 个字节的区域在堆区
free(p1);
free(p2);
}
------end
ps:小小总结,望对在路上的你有所帮助。