参考:
基本思想:
每个进程拥有自己的地址空间,地址空间被分成许多块,称为页面,每一页有连续的地址范围
与地址空间一样,物理内存也被分成许多块,块的大小与页一样大,称为页框。
页映射到页框,被程序引用,一旦程序引用到未映射的页,就会发生缺页中断,把引用的页映射到页框,再重新进行引用。
分页
-
进程并不直接引用物理内存地址,而是先引用虚拟地址,再由内存管理单元(Memory Manaement Unit, MMU)把虚拟地址映射为物理内存地址。
如下图
-
虚拟地址与物理内存地址的映射为页面与页框的映射关系,页面映射到了页框就意味着该页面在物理内存上。
如下图
一旦进程引用到了未映射的页面,就会发生缺页中断,从映射的页面中选一个,换上要用的页面,再重新进行引用。
页表
每个进程都有自己的页表,用于记录自己的虚拟地址和物理内存地址的映射情况,页表存在MMU。切换进程的时候,页表也会切换。
-
页表的最简单实现是:把虚拟地址分成虚拟页号(高位部分)和偏移0量(低位部分)。
虚拟页号作为页表的索引,找到相应的页表项,从而找到页框号,再由页框号和偏移量构成物理内存地址。
如下图:
-
页表项的结构基本如下:
- 在/不在位:1有效;0无效,引发缺页中断
- 修改位:1被修改过,移除页框时要写回磁盘;0未修改过,无需写回磁盘。
- 保护位:1读/写;2只读
-
高速缓存禁止位:对于映射到设备的页面,不能用被缓存的副本,要用最新的内容。(如键盘)
页表并不保存页面的磁盘地址,由另外的机制来保存。
关于分页的两个问题
- 虚拟地址到物理内存地址的映射必须非常快
- 如果虚拟地址空间很大,那页表也会很大。
-
加速分页过程
解决第一个问题,使用快表(TLB)。TLB是MMU的缓存,用于存储经常被访问到的页表项。
软失效: 页面访问不在TLB,在内存。仅需更新一下TLB,不需要产生磁盘I/O。
硬失效:页面不在内存。发生缺页中断。
针对大内存的页表
解决第二个问题。-
多级页表
把虚拟地址划分为PT1,PT2,Offset,PT1作为顶级页表的索引,PT2作为二级页表的索引。
结构上类似B+树。
一般最多2级,再往上会带来更大的复杂性。
-
对于32位还可以接受,64位需要耗费的空间太大。
-
倒排页表
一个页框为一个表项,而不是一个页面为一个表项,这样页表的大小取决于页框的数量而不是虚拟地址的大小。
缺点:虚拟地址转换为物理内存地址时要遍历整个页表。
改进:使用哈希表来存储。用虚拟地址来散列。这样无需遍历。
页面置换算法
其他
-
分离数据段和代码段,节省地址空间
父子进程共享代码段,数据段使用写时复制。
写时复制即数据段在未被修改时共享,一旦发生修改操作,就复制数据段,父子进程拥有独立的数据段。清除策略
启动一个分页守护进程的后台进程,定期唤醒检查分页情况,在空闲页框过少时,通过页面置换算法确保空闲页框的数量。