页转换
页转换主要实现了面向页的虚拟内存系统和页层次保护。若操作系统需要使用相关功能,则必须将CR0的PG位置位。
页(Page Frame)定义
页是一个以4KB的连续物理地址形成的单元。
线性地址(Linear Address)
线性地址通过制定一个页表(page table),表中的页(page),以及页中的偏移量间接地指定一个物理地址。线性地址共分为三部分,最高位10位为页目录的索引,中间10位为页表索引,最低位12位为页偏移量。
从线性地址转换为物理地址的寻址机制为:将31-22位地址作为索引从页目录(Page Directory)中寻找到对应页表(Page Table),将21-12位地址作为索引从页表中寻找到对应的页(Page Frame),再使用11-0位作为页偏移量(Offset)从页中找到对应的物理地址。
页表
页表本身是一个页,因此其拥有一个页大小的内存,即4KB。由于页表实质上是一个32位页指示符的数组,所以最多拥有1K项条目(4KB*8/32=1KB)。
页表有两层层次结构,其中位于高层次的页表仅有一个,被称为页目录(page directory),页目录指向了共1K个第二层次的页表(page table),而第二层次的每个页表指向1K个页,由此组织出二级页表层级结构。简单的计算可以得知,两级页表层级结构共可以指向1M(2(20))个页,而每个页包含有4Kb(2(12)bytes),因此含有一个页目录的二级页表层级结构共可以组织起4GB物理地址空间(2^(20) times 2^(12) = 2^(32))。
当前的页目录的物理地址将储存在CPU的CR3寄存器中,该寄存器也可以称为页目录基地址寄存器(page directory base register)。内存管理软件可以选择为所有任务(task)使用同一个页目录,也可以选择为每个任务使用单独的页目录,或者使用这两者的混合策略。
附1:虽然在理论上,所有任务都分别使用单独的页目录使得对每个任务而言,线性地址到物理地址的映射完全不同(通过页目录指向完全不同的页表、页表指向完全不同的页等等),但在实际中,必须要有部分的线性地址映射到相同的物理地址中。例如TSS地址和GDT等等。
附:在PG位被置位前,CR3寄存器必须已经被初始化并指向一个有效的页目录的物理地址。初始化进程必须采用以下两种策略中的一种以便保证启用页前后地址的一致性:
- 当前正在执行的页在PG位被置位前后必须映射到相同的物理地址中。
- 在PG位被置位后立即使用JMP指令跳转到正确的地址。
页表项(Page-Table Entries)
所有层次的页表中的项(entry)都具有相同的格式。其格式如下图所示。页表项的格式可以分为两部分,分别是页地址(Page Frame Address)和标识符.
页地址
页地址位指示了页的在内存中的物理地址(其中页目录中记录的页地址为页表的物理地址,页表中记录的页地址则指向包含所需要的地址的页帧)。由于页是以4KB大小对齐的,因此页头的物理地址的低12位将始终为0.由于这种特性,页表项中以高位31-12位共20位指示页地址,而剩下的低12位用于标识符记录项的状态信息。
存在位(Present Bit)
最低位P表示一个项是否存在(present)。当P=1时表示这个项记录的信息是可以用于进行地址转换的(或者说是有效的)。
当P=0时,无论这个项处在页表中的哪个层级,这个项都是无效的,即它不在地址转换中起到作用。而剩下的位(高位31位)可以供软件使用。当P=0时,其格式如下图所示。
如果在任何层次的页表中出现了试图对P=0的项中进行地址转换的情况,处理器则会发出一个页面异常的信号。在支持页虚拟内存的软件系统中,缺页异常(page-not-present exception)处理将请求的页加载到物理内存中,然后再次执行产生异常的指令。
注意到页目录本身没有存在位标识其是否存在。在一个任务被挂起时它的页目录有可能不被表示(not-present),但是操作系统必须确保TSS中的CR3映像所指示的页目录在任务dispatched之前存在于物理内存中。
已访问位和脏位(Accessed and Dirty Bits)
已访问位和脏位在两级页表中都表示页的使用情况。除了页目录项的脏位以外,这些位都由硬件设置;而处理器不会对已访问位和脏位进行清理。
在对页进行读或写操作之前,处理器会将对应的页表项的已访问位置为1.该操作对两层页表层级均是如此。在对某个页中的地址进行写操作之前,处理器会将对应的二级页表项的脏位置为1;而页目录项的脏位没有定义。
一个支持页虚拟内存的操作系统可以通过已访问位和脏位来决定当内存需求超过物理可用内存空间的时候,将哪些页从物理内存中删去。测试(test)和清除(clear)这些位是由操作系统来负责的。
读/写位和用户/管理员位(Read/Write and User/Supervisor Bits)
这些位并不是用于进行地址转换的,而是处理器在进行地址转换的同时,用于进行基于页的保护(page-level protection)时使用的数据。
页转换缓存(Page Translation Cache)
为了最大化地址转换的效率,处理器会将最近使用的页表数据存储在单片超高速缓存器(on-chip cache)中。只有当需要的分页信息没有在缓存器中的时候,两级页表才会被使用。
页转换缓存对于应用程序员(applications programmer)来说是不可见的,但是对于系统程序员(system programmer)来说是可见的;当页表改变的时候,操作系统程序员(operating-system programmer)必须刷新缓存区。页转换缓存可以使用以下两种方式进行刷新:
- 使用MOV指令重新载入(reloading)CR3寄存器,如:
MOV CR3, EAX - 切换到一个具有与当前CR3不同的CR3映像(CR3 image)的TSS。