A Clarification on Linux Addressing 翻译

A Clarification on Linux Addressing

本文是对文章"A Clarification on Linux Addressing" 的翻译。如有纰漏,敬请指正。

OK,以下是我个人迄今的理解,但不代表未来随着技术更迭而产生变化。

在X86 32位指令集体系架构中,最大的内存地址是4GB。这就是大家所熟知的“虚拟地址空间”,且这些地址被称作“虚拟地址”。要访问物理内存,更确切的说,访问一个物理的地址,需要对使用的虚拟地址进行段-页的计算,即所谓的“映射”过程。

                MMU
 virtual/   +----------------------+
    logical |  +----------------+  | logical is Intel terms
    ------->|  | Segmented Unit |  |
            |  +----------------+  |
            |          | linear    | 
            |  +----------------+  |
            |  | Paging Unit    |  |
            |  +----------------+  |
            |          |           |
            +----------|-----------+
                       | physical
                       |
                       v

为了访问一个物理页,则这个页必须要在进程的页表中,每个进程都有自己的页表,这些是基础的认知。

现在,有2个不易察觉的细节值得指出来:

首先,即使通常说一个进程被分配了唯一的4GB虚拟地址空间,但并不意味着进程可以在这个进程空间中“为所欲为”:如果要访问虚拟空间内部的一个特定的区域,进程必须先向Kernel请求一个可用的内存区域,相关的数据结构被称之为“vm_area_struct”或者叫 VMA。

第二点,在理论上一个进程的潜在访问能力是4GB,假设用户空间使用了libc,那么libc也会被映射到虚拟内存空间中,用户空间的应用也可以使用系统调用,这也就意味着kernel将代表这个进程工作,因此Kernel镜像也需要映射到进程的虚拟地址空间中,并且这种映射最好是永久性的,如果进程需要频繁切换到内核模式。临时的映射方案可行,但是意义不大。

综上,需要对这4GB的虚拟地址空间进行划分,依据用户和内核程序,也就是所谓的3G/1G划分,用户空间占据0-3GB ,内核空间占用3GB-4GB。

因此,在3G/1G划分中,kernel有1GB的虚拟地址空间,需要记住:要访问物理地址,需要从虚拟地址开始,包括kernel。因此,如果你不做特殊的处理,这1GB的虚拟地址空间限制了内核可以实际访问的物理地址空间在1GB以内。OK,这就引出了第3个值得关注的细节:Kernel需要能访问任意的物理内存,来充分使用这些内存。

在早期的机器的物理内存空间远远小于1GB,那么整个的物理内存都可以映射到虚拟地址空间中。

4GB +---------------+
        |     512MB     |
        +---------------+ <------+     physical memory               
        |     512MB     |        | 
    3GB +---------------+ <--+   +---> +------------+ 
        |               |    |         |   512 MB   |
        |     /////     |    +-------> +------------+
        |               |     
    0GB +---------------+

例如,物理地址{x}内映射到内核空间,虚拟地址中是{PAGE_OFFSET+x},PAGE_OFFSET被定义为3GB。

与此相关的2个观点:

1)当所有的物理内存都能够被直接映射到虚拟地址空间时,这些相关的虚拟地址也被称作Kernel逻辑地址,这些逻辑地址可以被映射到物理地址,通过一个常量的偏移,如3GB。

2)物理地址能够被映射到虚拟地址空间的,称作“Low Memory”,相反的,不能映射的称作High Memory。在上图中,所有的512字节都是Low Memory。

也许你会说,现在的机器都有2G甚至更多的内存,那又会怎么样呢?当你想访问物理内存高于1GB,或者精确些,896MB,kernel使用128MB的虚拟地址空间来临时映射这些虚拟地址到物理地址,这样来达到访问所有的物理内存Page的目的,这里有一些细节没有说明,比如,是否会保留这个128MB的预分配区。但是这点上我认为,可以跳过这点,聚焦于关键的问题点:使用临时的mapping来访问所有的物理内存。以下图形粗略的描述了这个方案:

                                     physical mem
       process address space    +------> +------------+
                                |        |  3200 M    |
                                |        |            |
    4GB +---------------+ <-----+        |  HIGH MEM  |
        |     128 MB    |                |            |
        +---------------+ <---------+    |            |
        +---------------+ <------+  |    |            | 
        |     896 MB    |        |  +--> +------------+         
    3GB +---------------+ <--+   +-----> +------------+ 
        |               |    |           |   896 MB   |
        |     /////     |    +---------> +------------+
        |               |     
    0GB +---------------+

回到Linux的上下文中:Kmalloc()将会返回给你一块虚拟内存,是的,没错,它执行虚拟地址,但是更重要的是这也是kernel的逻辑地址,意味着它映射的是连续的物理页。vmallc是另外一个重要的kernel调用,它返回一段虚拟内存块。但是,这个虚拟内存块,仅仅只是在虚拟空间上是连续的,在物理空间中可能是不连续的。因此,实际映射到的物理页不仅可以来自于低内存,也可以是高内存,尤其是当你想要一块大内存时。

在64位架构中

在这个架构中,3G/1G的划分并不奏效,由于有巨大的内存空间,可以轻易的将用户空间和内核空间分开,且能容易地将整个物理地址映射到内核的地址空间。

C pointer address question

关于C指针的一个有趣的现象:我们可以用C打印一个指针地址。对于用户空间应用程序,如果打印定义的指针地址,那么它应该是(0-3GB)范围之外的虚拟地址之一。

内核呢?如果在内核中打印一个指针地址呢?它总是来自内核地址空间吗?答案是否定的。因为内核可以访问用户空间地址,这取决于指针,它可以来自任何一个。

如何判断它是来自内核空间还是用户空间?是的,如果陷入到0-3GB,则来自用户空间,否则来自内核。无论如何,这里的关键信息是正在看到的虚拟地址。

这样明白了么?

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 222,000评论 6 515
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,745评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,561评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,782评论 1 298
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,798评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,394评论 1 310
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,952评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,852评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,409评论 1 318
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,483评论 3 341
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,615评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,303评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,979评论 3 334
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,470评论 0 24
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,571评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 49,041评论 3 377
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,630评论 2 359

推荐阅读更多精彩内容

  • 一、Linux内核地址映射模型 x86 CPU采用了段页式地址映射模型。进程代码中的地址为逻辑地址,经过段页式地址...
    Leon_Geo阅读 8,223评论 0 14
  • 1. 基础知识 1.1、 基本概念、 功能 冯诺伊曼体系结构1、计算机处理的数据和指令一律用二进制数表示2、顺序执...
    yunpiao阅读 5,333评论 1 22
  • 前言 内存管理一向是所有操作系统书籍不惜笔墨重点讨论的内容,无论市面上或是网上都充斥着大量涉及内存管理的教材和资料...
    木有sky阅读 907评论 0 1
  • 操作系统对内存的管理 没有内存抽象的年代 在早些的操作系统中,并没有引入内存抽象的概念。程序直接访问和操作的都是物...
    Mr槑阅读 16,704评论 3 24
  • 1.内存的页面置换算法 (1)最佳置换算法(OPT)(理想置换算法):从主存中移出永远不再需要的页面;如无这样的...
    杰伦哎呦哎呦阅读 3,259评论 1 9