1. 虚拟地址的意义
假设计算机128MB内存,程序A:10MB B:100MB C:20MB
如果只是将物理内存分配给ABC,存在一些问题:
- 所有程序直接访问物理地址,内存空间不是相互隔离的,恶意程序可以改写其他程序的内存数据
- 内存使用效率低下。没有内存管理机制,要将整个程序装入内存然后开始执行。如果先装入AB,这时候要运行C,就得把B拿出来,再装入C。
- 程序的运行地址不确定。因为每次装入运行都要分配足够大的空闲内存空间,但是这块空闲区域不确定。
解决思路:
增加中间层,也就是:把程序给出的地址看作虚拟地址,通过映射转换成物理地址
2. 物理地址空间和虚拟地址空间
物理地址空间:假设计算机地址线32条,那物理空间就是=4GB,但是计算机上只装了512MB=,那么实际有效的物理地址是0x00000000-0x1FFFFFFF。其他部分无效
虚拟地址空间:并不存在,每个进程都有其虚拟地址空间且只能访问自己的虚拟地址空间
这样就实现了进程隔离!
3.分段
基本思路:将程序所需要的内存空间大小的虚拟空间映射到相同大小的物理地址空间。映射过程由软件(操作系统)完成,实际的地址转换由硬件(CPU)完成。
分段:程序A和B被映射到两块不同的物理空间区域,之间没有重叠。对于程序来说,不需要关心物理地址的变化,只需要在虚拟地址空间的范围内来编写程序、防止变量,程序不需要再重定位。
问题:没有解决第二个问题:内存使用效率问题。分段对内存区域的映射还是按照程序为单位的,如果内存不足,换入唤出到磁盘的是整个程序。
4.分页
基本方法:把物理地址空间等分成固定大小的页,每一页的大小由硬件决定(目前几乎所有PC的操作系统都使用4KB大小)。
页映射机制:VP:虚拟页 PP:物理页 DP:磁盘页。
进程中的部分虚拟页面被映射到物理页,部分页面在磁盘中。虚拟空间有些页被映射到同一个物理页,可以实现内存共享。
进程1的VP2和VP3不在内存中,当进程需要这两个页时,硬件会捕获这个消息(产生页错误),然后操作系统会接管进程,负责将VP2和VP3从磁盘中读出来并装入内存。
保护:每个页可以设置权限属性。
几乎所有的硬件都采用MMU(内存管理单元)来进行页映射。页映射模式下,CPU发出虚拟地址,我们程序看到的也是虚拟地址。经过MMU转换成物理地址。
5.线程
什么是线程
一个标准的线程由线程ID、当前指令指针(PC)、寄存器集合和堆栈组成。一个进程由一个到多个线程组成,各个线程之间共享程序的内存空间和一些进程资源。
线程的访问权限
线程可以访问进程内存里的所有数据,包括其他线程的堆栈(如果知道地址的话)。
线程的调度
Linux的多线程
Linux将所有的执行实体都称为任务。任务的概念类似于单线程的进程。共享了同一个内存空间的多个任务构成了一个进程,这些任务也就成了这个进程里的线程。
创建一个新的任务:
fork函数产生一个和当前进程完全一样的新进程,并从fork函数里返回。fork并不复制原任务的内存空间,而是和原任务一起共享一个写时复制。
写时复制:两个任务可以同时自由地读取内存,但任意一个任务试图对内存进行修改时,内存就会复制一份提供给修改方单独使用。
fork函数只能产生本任务的镜像,所以要exec函数配合使用才能启动别的新任务。产生新的线程要使用clone函数。