连续分配方式:一个进程连续的装进内存一个大小合适的区。
->“碎片”->“紧凑”->增大开销
如果允许一个进程直接分散装入多个不相邻分区中,则无需“紧凑”
产生存储管理的离散分配方式。
3. 基本分页存储管理方式
本部分讨论不具备对换功能的纯分页模式,作业运行需要全部装入内存。
比较连续分配方式
作业逻辑地址空间有M大,就需要向内存申请一个M大的连续区域。
分页的目的是更细粒度的处理空间,减少粗放管理的浪费或开销问题。
离散分配内存:
作业规定大小划分成小份;内存也按同样大小划分成小份
作业的任一小份可分散放入内存任意未使用的小份
分页方式下,内存的使用率高,浪费少。但不是绝对没有碎片(进程的最后一页不总是能占满一个物理块)
1)页面的概念
内存划分成多个小单元,每个单元K大小,称(物理)块。作业也按K单位大小划分成片,称为页面。
① 物理划分块的大小 = 逻辑划分的页的大小
②页面大小要适中。太大,(最后一页)内碎片增大,类似连续分配的问题。太小的话,页面碎片总空间虽然小,提高了利用率,但每个进程的页面数量较多,页表过长,反而又增加了空间使用。
2)页表的概念
为了找到被离散分配到内存中的作业,记录每个作业各页映射到哪个物理块,形成的页面映射表,简称页表。
每个作业有自己的页表
页表的作用:
页号到物理块号的地址映射
要找到作业A
关键是找到页表(PCB)
根据页表找物理块
3)地址的处理
连续方式下,每条指令用基地址+偏移量即可找到其物理存放的地址。
分页方式下详细的地址处理会如何呢?
地址映射(地址计算)的过程?
若要执行某作业的一条指令,其相对地址是24B (设10B一页,页表如右表),其物理地址到底是多少呢?
分析其所在的页和偏移得:2号页(页号从0开始) ,偏移4B处是该条指令
查页表找页面对应的块(2号页保存在6号物理块)
找物理块6,向下偏移4B,找到要执行的指令。取出执行即可。
计算上就是求商(页号)及取余(偏移量)的过程
规律
作业相对地址在分页下不同位置的数有一定的意义结构:
页号+页内地址(即页内偏移)
关键的计算是:根据系统页面大小找到不同意义二进制位的分界线。
从地址中分析出页号后,地址映射只需要把页号改为对应物理块号,偏移不变,即可找到内存中实际位置。
注意:一作业所有指令在用户地址空间是顺序编址
上例若作业页表如右表所示,任意取一用户程序指令,如第1011个指令,如何知道放在内存的哪里?
重要参数:系统页面大小=8B
页内的所有指令编址用了3位
111增一后进位,下一条第9条指令已经到了下一页1000
1011中的1代表是1号页,而011代表是该页中偏移3B后的第4条,
根据页表,1号页存在7#物理块上。
7#物理块又在哪?
物理块的编址也是8B大小决定的,地址结构类似
7#块的第一条指令地址是111000。第7块中向下偏移3就是要找的指令。其地址就是111011。
4)地址变换机构
前面讲解了地址变换的原理,那么谁具体实现地址映射?——地址变换机构。
围绕页表进行工作,那么页表数据放在哪?
寄存器。一个进程有n个页,页表就需要记录n项数据,需要n个寄存器。不现实。
内存。只设置一个页表寄存器PTR(page table register)记录页表在内存中的首地址和页表长度,运行时快速定位页表。
地址变换过程
分页系统中,进程创建,放入内存,构建页表,在PCB中记录页表存放在内存的首地址及页表长度。
运行某进程A时,将A进程PCB中的页表信息写入PTR中;
每执行一条指令时,根据分页计算原理,得到指令页号X和内部偏移量Y;
CPU高速访问PTR找到页表在哪里;
查页表数据,得到X实际对应存放的物理块,完成地址映射计算,最终在内存找到该指令。
访问内存的有效时间
进程发出逻辑地址的访问请求,经过地址变换,到内存中找到对应的实际物理地址单元并取出数据,所需花费的总时间,称为内存的有效访问时间EAT(effective access time)
设访问一次内存时间为t,则基本分页机制下EAT=2t,why?
CPU操作一条指令需访问内存两次:
访问内存中的页表(以计算指令所在的实际物理地址)
访问指令内存地址
5)引入快表——针对访问速度问题
问题:基本分页机制下,一次指令需两次内存访问,处理机速度降低1/2,分页空间效率的提高以如此的速度为代价,得不偿失。
改进:减少第1步访问内存的时间。增设一个具有“并行查询”能力的高速缓冲寄存器,称为“快表”,也称“联想寄存器”(Associative memory),IBM系统称为TLB(Translation Look aside Buffer)。
快表放什么?:
正在执行进程的页表的数据项。
引入快表后的内存访问时间如何?
快表的寄存器单元数量是有限的,不能装下一个进程的所有页表项。虽不能完全避免两次访问内存,但如果命中率a高还是能大幅度提高速度。
设一次查找访问快表时间为t' ,则
EAT= a*t' + (1-a)(t'+t) + t
= 2t +t' -t*a
6)两级、多级页表,反置页表�——针对大页表占用内存问题
页表大小的讨论
进程分页离散存放,但页表的数据是连续在存放内存的。而页表可能很大:
现代操作系统支持非常大的逻辑地址空间的进程。如32位系统,可编址的最大代码数为232,若页面大小为4KB(4*210),则支持的最大进程页表项数可达码232/212=220,有1M个,每个页表项占1B(字节),则页表大小就有1MB。
①两级页表
将页表分页,并离散地将页表的各个页面分别存放在不同的物理块中
为离散分配的页表再建立一张页表,称为“外层页表”,其每个表项记录了页表页面所在的物理块号。
32位逻辑地址空间,页面大小为4KB(即12位)
一级页表机构,剩余20位是页号,可编出的220个页(也即页表长1M/或页表项有1M个);
两级页表:讨论页表的分页
分页原理类似:
将页表也按4K大小分页(212)
页表被分页后,页表的一个外页4K,外页偏移量需10位,为什么?
课本将页表每1024个页表项就分一外页,外页内的偏移需要10位。可理解为每个页表项占4B(块号、权限等),如此一外页页表信息才占满一个4KB大小的物理块
②多级页表
64位操作系统下,两级仍然不足以解决页表过大问题时,可按同样道理继续分页下去形成多级页表。
③反置页表
每个进程一张页表
一张OS 反置页表 + 每进程一张外部页表
反置页表(Inverted Page Tale):站在物理块的角度,记录占用它的已调入内存的进程标识和页号。系统中只需一张该表即可。一个64MB内存,若页面大小4KB(64M/4K=2^16=16K个物理块),反置页表占用64KB(16K*4B)
进程外部页表(External Page Table):每个进程一张,记录进程不在内存中的那些页面所在的外存物理位置。
如何提高检索反置页表速度:内存容量大时,反置页表的页表项还是会很大,利用进程标识符和页号去检索一张大的线性表很费时,可利用hash算法提高检索速度。
4.基本分段存储管理方式
从提高内存利用率角度;
固定分区->动态分区->分页
从满足并方便用户(程序员)和使用上的要求角度:
分段存储管理:作业分成若干段,各段可离散放入内存,段内仍连续存放。
方便编程:如汇编中通过段:偏移确定数据位置
信息共享:同地位的数据放在一块方便进行共享设置
信息保护
动态增长:动态增长的数据段事先固定内存不方便
动态链接:往往也是以逻辑的段为单位更方便
1)分段系统的基本原理
程序通过分段(segmentation)划分为多个模块,每个段定义一组逻辑信息。如代码段(主程序段main,子程序段X)、数据段D、栈段S等。
谁决定一个程序分几段,每段多大?
编译程序(基于源代码)
段的特点
每段有自己的名字(一般用段号做名),都从0编址,可分别编写和编译。装入内存时,每段赋予各段一个段号。
每段占据一块连续的内存。(即有离散的分段,又有连续的内存使用)
各段大小不等。
分段下的相对地址:
地址结构:段号 + 段内地址
段表:记录每段实际存放的物理地址
2)段表与地址变换机构
段是连续存放在内存中。段表中针对每个“段编号”记录:“内存首地址”和“段长”
同样有两次内存访问问题
解决方法:设置联想寄存器,用于保存最近常用的段表项。
3)分页和分段的主要区别
①需求:分页是出于系统管理的需要,是一种信息的物理划分单位,分段是出于用户应用的需要,是一种逻辑单位,通常包含一组意义相对完整的信息。
一条指令或一个操作数可能会跨越两个页的分界处,而不会跨越两个段的分界处。
②大小:页大小是系统固定的,而段大小则通常不固定。分段没有内碎片,但连续存放段产生外碎片,可以通过内存紧缩来消除。相对而言分页空间利用率高。
③逻辑地址:
分页是一维的,各个模块在链接时必须组织成同一个地址空间;
分段是二维的,各个模块在链接时可以每个段组织成一个地址空间。
④其他:通常段比页大,因而段表比页表短,可以缩短查找时间,提高访问速度。分段模式下,还可针对不同类型采取不同的保护;按段为单位来进行共享
4)信息共享
分段系统的突出优点:
易于实现共享
在分段系统中,实现共享十分容易,只需在每个进程的段表中为共享程序设置一个段表项。
比较课本图。对同样的共享内容的管理上,很明显分段的空间管理更简单。分页的图涉及太多的页面划分和地址记录的管理。
易于实现保护:
代码的保护和其逻辑意义有关,分页的机械式划分不容易实现。
分页容易造成共享和非共享数据共处一页,不方便设置权限。
可重入代码:
又称为纯代码,允许多个进程同时访问的代码
不允许任何进程对它进行修改。
可共享的代码必须是可重入的;
5)段页式存储管理方式
① 基本原理
将用户程序分成若干段,并为每个段赋予一个段名。
把每个段分成若干页
地址结构包括段号、段内页号和页内地址三部分
②地址变换过程
进程的虚存空间是映射的基础
Linux仅把运行进程当前使用的少量页面装入内存(内存分配)
地址映射。若访问的虚页不在内存,产生一个页故障并报告故障原因,再通过请页机制将其调入内存。(请页、交换)
linux下虚拟空间的管理
malloc分配的是虚存区,只有内核管理为进程创建空间,由内核代码实际执行alloc_pages()等内核函数时才真正分配内存
现阶段分配方式的不足:
基本分页/分段方式都是进程全部装入内存的方式。内存空间使用上仍有局限。
虚拟存储管理:请求式分页/分段