1. 虚拟存储器的基本概念
分析常规存储器管理不足的原因:
1)常规存储器管理方式的特征
一次性:作业在运行前一次性地全部装入内存
驻留性:作业装入内存后,便一直驻留在内存中,直至作业运行结束。
一次性及驻留性在程序运行时是否是必须的?
NO。程序运行有局部性。
2)局部性原理
1968年,Denning.P提出
程序在执行时将呈现出局部性规律:
在一较短的时间内
程序的执行仅局限于某个部分;
相应地,所访问的存储空间也局限于某个区域。
程序执行的特点:
多数情况下仍是顺序执行。
少部分的转移和过程调用指令会使程序执行由一部分区域转至另一部分区域(但研究表明调用深度多数情况下不超过5)
许多由少数指令构成的循环结构会多次执行。
对许多数据结构的处理(如数组)往往局限于很小的范围内。
所有上述情况都表现出程序执行的局部性:
时间局部性(temporal locality)
被引用过一次的存储器位置很可能在不远的将来再被多次引用。
空间局部性(spatial locality)
如果一个存储器位置被引用了一次,那么程序很可能在不远的将来引用附近的一个存储器位置。
关于局部性的讨论
有良好局部性的程序运行速度更快;
计算机系统的各个层次都利用了局部性:
Cache;
主存:缓存磁盘文件系统最近使用的磁盘块;
Web浏览器将最近被引用的文档放在本地磁盘上;
Web服务器将最近被请求的文档放在前端磁盘高速缓存中。
重复引用同一个变量的程序有良好的时间局部性;
对于使用数组等数据结构的程序,a[1],a[2]……数据的使用可看做具有步长k=1的引用模式,步长越小,空间局部性越好;数组按行访问和按列访问其局部性不同。
对于取指令来说,循环有好的时间和空间局部性;
循环体越小,循环迭代次数越多,局部性越好。
基于局部性原理
程序运行前,不需全部装入内存(打破一次性)
仅装入当前要运行的部分页面或段即可运行,其余部分暂留在外存上。
缺页/段的情况:要访问的页(段) 尚未调入内存。程序应利用OS所提供的请求调页(段)功能,将它们调入内存,使程序继续执行。
调入需要的页/段时,如果内存已满,无法再装入新页(段),通过置换功能将内存中暂时不用的页(段)调至外存,腾出足够的内存空间。(不总驻留)
交换技术与虚存使用的调入调出技术有何相同和不同之处?
主要相同点是都要在内存与外存之间交换信息;
主要区别在于交换技术换出换进一般是整个进程(proc结构和共享正文段除外),因此一个进程的大小受物理存储器的限制;
而虚存中使用的调入调出技术在内存与外存之间来回传递的是存储页或存储段,而不是整个进程,从而使得进程映射具有了更大的灵活性,且允许进程的大小比可用的物理存储空间大的多 。
总之:
为了用小的内存实现在大的虚空间中程序的运行目的
基于局部性原理
虚拟存储器管理——由操作系统提供一个比实际内存大的,假想的特大存储器。
3)虚拟存储器的定义
所谓“虚拟存储器”,是指具有请求调入功能和置换功能,能从逻辑上对内存容量加以扩充的一种存储器系统。
虚拟存储管理下
内存逻辑容量由内存容量和外存容量之和所决定
运行速度接近于内存速度
每位的成本却接近于外存。
4)虚拟存储器的实现
虚拟存储管理:
允许将一个作业分多次调入内存。
若采用连续分配方式,需申请足够空间,再分多次装入,造成内存资源浪费,并不能从逻辑上扩大内存容量。
虚拟的实现建立在离散分配存储管理基础上
方式:请求分页/请求分段系统
细节:分页/段机构、中断机构、地址变换机构、软件支持
5)虚拟存储器的特征
离散分配方式是基础
多次性:一个作业被分成多次调入内存运行
对换性:允许在作业的运行过程中进行换进、换出。(进程整体对换不算虚拟)
最终体现虚拟性:能够从逻辑上扩充内存容量,使用户所看到的内存容量远大于实际内存容量。
2. 请求分页存储管理方式
基本分页 + “请求调页”和“页面置换”功能。
换入和换出基本单位都是长度固定的页面
1)硬件支持
一台具有一定容量的内/外存的计算机+ 页表机制+ 缺页中断机构+ 地址转换机构
①页表基本功能不变:逻辑地址映射为物理地址
增加虚拟功能后需记录的页表项信息有变化:
(1) 状态位P :指示该页是否已调入内存。
(2) 访问字段A :用于记录本页在一段时间内被访问的次数,或记录本页最近已有多长时间未被访问。(置换时考量的参数)
(3) 修改位M :该页在调入内存后是否被修改过。(关系到置换时调出的具体操作)
(4) 外存地址:用于指出该页在外存上的地址。
②缺页中断机构
每当要访问的页面不在内存时,便产生一缺页中断通知OS,OS则将所缺之页调入内存。作为中断,需经历几个步骤:
“保护CPU环境”
“分析中断原因”
“转入缺页中断处理程序”
“恢复CPU环境”等。
作为一种特殊中断,与一般中断有明显区别:
(1) 在指令执行期间产生和处理中断信号。
(2) 一条指令在执行期间,可能产生多次缺页中断。
Copy A to B可能产生6次缺页中断。
系统应能记录每次中断的状态。
③地址变换机构
分页系统地址变换机构的基础上增加
产生和处理缺页中断(请求调入)
从内存中换出一页的功能(置换)
2)内存分配
作业不一次装入,部分装入的情况下如何为进程分配内存,涉及三个问题:
①最小物理块数的确定
少于此数量进程将不能运行
与计算机的硬件结构有关,取决于指令的格式、功能和寻址方式
②物理块的分配策略
考虑:固定OR可变分配、全局OR局部置换。
组合出三种适合的策略。
固定分配、局部置换
为每个进程分配一定数目的物理块,在整个运行期间不再改变(基于进程的类型,或根据程序员、程序管理员的建议)
运行中缺页时,只能从该进程内存中n个页面中选出一页换出,然后再调入一页。
困难:难以把握为每个进程分配“适量”物理块数
可变分配、全局置换
先为每个进程分配一定数目的物理块
OS管理一个空闲物理块队列,发生缺页时,系统从队列中取出一块分配给该进程,将欲调入的页装入(动态增长型,全局空闲空间都可分配使用)
空闲空间不足时,可与其他任何进程页面置换。“会使其他进程缺页率提高,影响运行”
最易实现
可变分配、局部置换
为每个进程分配一定数目的物理块
缺页时,只允许换出该进程在内存的页面,不影响其他进程执行。
根据缺页率增减进程的物理块数:若频繁缺页中断,则系统再为进程分配若干物理快;若缺页率特别低,则适当减少分配给该进程的物理块。
③物理块的分配算法
固定分配策略时,分配物理块可采用以下几种算法:
平均分配算法
将所有可供分配的物理块平均分配给各进程。
缺点:未考虑各进程本身的大小,利用率不均。
按比例分配算法
根据进程的大小按比例分配物理块。
设系统中共有n个进程
则,每个进程能分到的物理块数:
Si:进程i页面数为; S:n个进程页面数总和; m:可用物理块总数
考虑优先权的分配算法
实际应用中,要照顾重要、急迫的作业尽快完成,为它分配较多的内存空间。
所有可用物理块分两部分:
一部分按比例分配给各进程;
另一部分根据各进程优先权,适当地为其增加份额,分配给各进程。
3)调页策略
① 何时调入页面
1.预调页策略
以预测为基础,将预计不久后便会被访问的若干页面,预先调入内存。
优点:一次调入若干页,效率较好
缺点:预测不一定准确,预调入的页面可能根本不被执行到。主要用于进程的首次调入,由程序员指出应该先调入哪些页。
2.请求调页策略
运行中需要的页面不在内存,便立即提出请求,由OS将其调入内存。
优点:由请求调页策略所确定调入的页,一定会被访问;比较容易实现。
缺点:每次仅调入一页,需花费较大的系统开销,增加了磁盘I/O的启动频率。
② 从何处调入页面
在请求分页系统中的外存分为:
对换区:连续存放数据,读写速度较快
文件区:离散分配方式,I/O速度相对慢
发生缺页时,系统应从何处将缺页调入内存,分成三种情况:
系统拥有足够的对换区空间:进程运行前所有页面由文件区拷贝到对换区;运行需要的页面全部从对换区调入内存,提高调页速度。
系统缺少足够的对换区空间:不会被修改的部分,在文件区操作(即:直接从文件区调入,换出时不用写入文件,再调入时仍从文件区调入)可能被修改的部分,在对换区操作。
UNIX方式:(随运行数据逐渐从文件区转到对换区)未运行的页面从文件区调入;曾经运行,但又被换出的页面放在对换区,下次调入应从对换区调入。进程请求的共享页面可能已被其他进程调入,无需再从对换区调入。
③ 页面调入过程
程序运行前需要装入内存:上述的②步策略处理何处调入;
开始运行:先预调入一部分页面;
运行中:需要的页面不在内存时,
向CPU发出一缺页中断,“中断处理程序”开始工作:
首先保留CPU环境
分析中断原因后,转入缺页中断处理程序。
处理:判断是否置换、页表信息更新
恢复现场,重新操作页面。
3.页面置换算法
进程运行过程中,访问的页面不在内存,调入时内存已无空闲空间,需要将内存中的一页程序或数据调到外存。
页面置换算法(page replacement algorithms):选择换出哪些页面的算法,其好坏直接影响系统的性能。
应具有较低的缺页率:
1)最佳(Optimal)置换算法
Belady,1966年提出的一种理论上的算法
换出以后永不再用的,或在最长(未来)时间内不再被访问的页面。
优点:保证获得最低的缺页率
不足:无法实现,因为无法预知一进程将来的运行情况
作用:作为参照标准,评价其他算法。
例1:假设一个作业,运行中依次使用的页面情况如下,分配给该进程的内存物理块只有3个,按最佳置换算法,内存中的页面如何变化,缺页率是多少?
2)先进先出置换算法(FIFO)
先进入的先淘汰,即选择内存中驻留时间最久的页面予以淘汰。
优点:实现简单,把一进程已调入内存的页面按先后次序组织成一个队列,并设置一个指针(替换指针),使它总是指向队首最老的页面。
不足:与进程实际运行规律不相适应(较早调入的页往往是经常被访问的页,频繁被对换造成运行性能降低)
对例1用FIFO算法计算:
系统用队列对先进先出的页面次序进行记录
队列最长等于分配的物理块数
始终置换队首的最老页面
Belady 现象
Belady现象:出现分配的页面数增多,缺页率反而提高的异常现象。
描述:一个进程P要访问M个页,OS分配N个内存页面给进程P;对一个访问序列S,发生缺页次数为PE(S,N)。当N增大时,PE(S, N)时而增大,时而减小。
Belady现象的原因:FIFO算法的置换特征与进程访问内存的动态特征矛盾,即被置换的页面并不是进程不会访问的。
3)最近最久未使用(LRU)置换算法
无法预测将来的使用情况,只能利用“最近的过去”作为“最近的将来”的近似,因此,LRU置换算法选择最近最久未使用(least recently used)的页面予以淘汰。
对例1用LRU算法计算:
不足:
有时页面过去和未来的走向之间并无必然的联系。
相应的需较多的硬件支持:记录每个页面自上次被访问以来所经历的时间t,淘汰时选择页面t值最大的;以及需要快速地知道哪一页是最近最久未使用的页面,用寄存器或栈。
①寄存器记录时间的原理
一进程有8个页面,每个页面需配备一个8位的(移位)寄存器。
移位寄存器表示为
R=Rn-1Rn-2Rn-3…R2R1R0
页面被访问后的操作:
将该页对应的寄存器的Rn-1位置为1
如何记时:
由系统发出定时信号,每隔一定时间将所有寄存器右移1位。
某一时刻,比较各寄存器的值,被用到的标志1逐渐往低位上积累,若高位上没有1,就说明最近没用过。所以最近最久未使用的就是寄存器值最小的那个页。
②栈记录时间的原理
某页面被访问,便将该页面的页面号从栈中移出,将它压入栈顶。因此:栈顶始终是最新被访问页面的编号,越久未使用,页面越被压在栈底。
练习:某程序在内存中分配三个页面,初始为空,页面走向为4,3,2,1,4,3,5,4,3,2,1,5。
试分别利用OPT、FIFO及LRU算法计算缺页次数。
4)轮转算法(clock)�又称最近未使用算法(NRU, Not Recently Used)
LRU(最近最久未使用算法)近似算法
折衷FIFO
每个页设一个使用标志位(use bit),若该页被访问则将其置为1。
设置一个指针,从当前指针位置开始按地址先后检查各页,寻找use bit=0的页面作为被置换页。
若指针经过的页use bit=1,修改use bit=0(暂不凋出,给被用过的页面驻留的机会 ),指针继续向下。到所有页面末尾后再返回队首检查。
时钟算法示例
说明:
增加了一个使用位
当一页首次加载入内存时,该位为1,当该页被访问时,使用位也置1
当需要进行页替换时
第一个使用位为0的帧被替换,指针指向缓冲区的下一帧
循环扫描,遇到使用位为1的,变成0
改进CLOCK
改进:主要考虑对没访问过的页面再细分是否修改过的不同情况,减少因修改造成的频繁I/O操作。
每页除记录是否用过A,还记录是否修改的标志M。置换时根据两个标志的值有4种不同情况的处理。
算法性能比较
5)其他置换算法
①最少使用 (LFU, Least Frequently Used)
关键在次数记录上
每页设置访问计数器,每当页面被访问时,该页面的访问计数器加1;缺页中断时,淘汰计数值最小的页面,并将所有计数清零;
计数的实现类似LRU,用移位寄存器,但比较时不是简单比较寄存器的值,而是比较寄存器每位的和∑Ri。
LRU与LFU
1000101
0001111
LFU置换次数少的。程序局部性会导致一个页面在一段时间内使用次数很多。但使用次数多并不能说明将来被用到的可能性大
而LRU置换最近最久未用的,对未来的预计一般会更好些。
所有,LRU相对得到较好的应用。
②页面缓冲算法PBA(page buffering algorithm)
对FIFO算法的发展,弥补了FIFO可能造成的I/O开销,又不需要LRU等算法的硬件支持。
仍用FIFO算法选择被置换页
但并不将其马上换入外存。
系统将页面放入两个链表之一:如果页面未被修改,就将其归入到空闲页面链表的末尾;否则将其归入到已修改页面链表。
需要调入新的物理页面时,将新页面内容读入到空闲页面链表的第一项所指的页面,然后将第一项删除(从空闲链表摘下)。
空闲页面和已修改页面,仍停留在内存中一段时间,如果这些页面被再次访问,只需较小开销,而被访问的页面可以返还作为进程的内存页。
当已修改页面达到一定数目后,再将它们一起调出到外存,然后将它们归入空闲页面链表,这样能大大减少I/O操作的次数。
常用防抖动方法:
局部置换策略;
页面调入内存前检查各进程工作集,为缺页率高的增加有限物理块;
L缺页间的平均时间=S置换一个页面所需时间,可使磁盘和cpu达到最大利用率;
抖动发生时选择暂停一些进程,调节多道程序度。
缺页率与物理块数有关联,基于程序局部性原理,若能预知程序在某段时间要访问的页面并全部调入他们,将大大降低缺页率。
Denning提出工作集概念:
某段时间间隔中,进程实际要访问的页面的集合。可以用一个二元函数W(t, )来表示, t是当前的执行时刻, 称为工作集窗口(working-set window )。
工作集大小的变化
进程开始执行后,随着访问新页面逐步建立较稳定的工作集。
当内存访问的局部性区域的位置大致稳定时,工作集大小也大致稳定;
局部性区域的位置改变时,工作集快速扩张和收缩过渡到下一个稳定值。
实现工作集模型的困难是怎样跟踪工作集的轨迹!
工作集模型的原理:
操作系统跟踪每个进程的工作集,并为进程分配大于其工作集的物理块。
如果还有空闲物理块,则可以再调一个进程到内存以增加多道程序数。
如果所有工作集之和增加以至于超过了可用物理块的总数,那么操作系统会暂停一个进程,将其页面调出并且将其物理块分配给其他进程,防止出现抖动现象。
正确选择工作集的大小,对存储器的利用率和系统吞吐量的提嵩,都将产生重要影响。
W(t,△) 表示该进程在过去的△个虚拟时间单位中被访问到的页的集合。
驻留集
驻留(常驻)集是指在当前时刻,进程实际驻留在内存当中的页面集合。
工作集是进程在运行过程中固有的性质,而驻留集取决于系统分配给进程的物理页面数目,以及所采用的页面置换算法;
如果一个进程的整个工作集都在内存当中,即驻留集 工作集,那么进程将很顺利地运行,而不会造成太多的缺页中断(直到工作集发生剧烈变动,从而过渡到另一个状态);
当驻留集达到某个数目之后,再给它分配更多的物理页面,缺页率也不会明显下降。
4.请求分段存储管理方式
在请求分段系统中,程序运行之前,只需先调入若干个分段(不必调入所有的分段),便可启动运行。当所访问的段不在内存中时,可请求OS将所缺的段调入内存。
1)请求分段中的硬件支持
①段表机制
(1) 存取方式 :用于标识本分段的存取属性。R,R/W,W
(2) 访问字段A :用于记录本段被访问的频繁程度。
(3) 修改位M :表示该段在调入内存后是否被修改过。
(4) 存在状态位P :指示该段是否已调入内存。
(5) 增补位 :特有字段,表示该段运行中是否做过动态增长
(6) 外存地址:用于指出该段在外存上的起始地址(盘块号)。
②缺段中断机构
发现运行进程所访问段尚未调入内存
由缺段中断机构产生一缺段中断信号
进入OS,由缺段中断处理程序将所需的段调入内存。
缺段中断同样在一条指令的执行期间产生和处理中断,一条指令执行可能产生多次缺段中断。但不会出现一条指令被分割在两个分段中或一组信息被分割在两个分段中的情况。
③ 地址变换机构
基于分段系统地址变换机构的基础
段调入内存
修改段表
再利用段表进行地址变换。
总之:就是增加了缺段中断的请求及处理等功能。
2)分段的共享和保护
分段在逻辑意义上划分,实现共享和保护都较方便。以下讨论具体实现:
①实现共享:共享段表
在内存中配置一张共享段表,每个共享段都占有一表项,记录如下内容:
共享计数count:
共享段为多个进程所需要,当某进程不再需要它而释放它时,系统并不回收该段所占内存区,仅当所有共享该段的进程全都不再需要它时,才由系统回收该段所占内存区。设置count用于记录有多少个进程需要共享该分段。
存取控制字段:一个共享段给不同的进程以不同的存取权限。
段号:对一个共享段,不同的进程可用不同的段号。
② 共享段如何分享与回收
共享段的分配
第一个请求使用该共享段的进程A:系统为该共享段分配一物理区,再把共享段装入该区;
将该区的始址填入A的段表相应项;
共享段表中增加一表项,填写有关数据,count置1;
其他进程B也调用该共享段时,无需再为该段分配内存,只需在B的段表中增加一表项,填写该共享段的物理地址;在共享段的段表中,填上调用进程的进程名、存取控制等,再执行count:=count+1操作。
共享段的回收
包括撤消在进程段表中共享段所对应的表项,执行count:=count-1。
如果count为0,则由系统回收该共享段的物理内存,并取消共享段表中该段所对应的表项。
③ 分段保护
越界检查
段表寄存器存放了段表长度;段表中存放了每个段的段长。
在进行存储访问时,将段号与段表长度比较,段内地址与段长比较。
存取控制检查
尤其表现在不同进程对共享段的不同使用上。段表每个表项都设置“存取控制”字段,规定该段的访问方式:只读,只执行,读/写
环保护机构
规定:低编号的环具有高优先权
遵循的原则:一个程序可以访问驻留在相同环或较低特权环中的数据。一个程序可以调用驻留 在相同环或较高特权环中的服务