第六讲 流水线处理器(Pipelined Processor)

内容要点:流水线,相关和冒险

1. 流水线基本原理

  1. 执行指令的主要步骤(MIPS)
1. 取指(Fetch) 从存储器取指令,更新PC
2. 译码(Decode) 指令译码,从寄存器堆读出寄存器的值
3. 执行(Execute) 运算指令:进行算术逻辑运算
访存指令:计算存储器地址
4. 访存(Memory) Load指令:从存储器读数据
Store指令:将数据写入存储器
5. 回写(Write-back) 将数据写入寄存器堆
添加流水线寄存器.png

2. 流水线寄存器性能分析

  • 流水线中的各个处理部件可并行工作,从而可使整个程序的执行时间缩短
  • 流水线并不会缩短单条指令的执行时间(甚至会增加),从而提高了指令的吞吐率
  • 流水线的最终性能目标:最大的指令吞吐率!


    流水线处理器性能分析.png

3. ”超级流水线“技术(Super Pipelining)

  1. 将五级流水线细分为更多的阶段,增加流水线的深度
  2. 提升时钟频率,从而提高指令吞吐率
  3. 比如:5级(T=200ps+50ps=250ps)=>10级(T=100ps+50ps=150ps)
  4. 但单条指令延迟:5级(250*5=1250ps)=> 10级(150*10=1500ps)
  5. 级数不是越多越好(现在一般15级左右)
    • 13年,Core i7(Haswell):14级
    • 13年,Cortex-A57:15级

4. 超标量流水线

  1. 超标量结构(Superscalar):通常具有两条或两条以上并行工作的流水线结构
  2. 使用该结构的处理器称为超标量处理器
  3. 标量和超标量流水线
    • 单周期 -> 标量流水线:时间并行性的优化,主要是对现有硬件的切分
    • 标量 -> 超标量:空间并行性的优化,需成倍增加硬件资源
  4. 超标量流水线与多核CPU
    • 现代的多核CPU通常是在一个CPU芯片中集成了多个超标量处理器核
  5. Pentium的超标量流水线(第一款超标量X86 CPU)
    • 两条流水线:”U流水“和”V流水“
    • 每条流水线都拥有自己的地址生成逻辑、ALU及数据Cache接口
    • 在一个时钟周期内,可以同时发送两条指令
  6. CDC6600:第一台超级计算机(1964)
  7. Cortex-A9的超标量流水线
    • 4发射,8~11级流水
  8. Core i7的超标量流水线
    • 4发射,16级流水

5. 冒险(Hazard)

阻止下一条指令在下一个时钟周期开始执行的情况

  1. 结构冒险

    • 所需要的硬件部件正在为之前的指令工作

      1. 如果指令和数据放在同一个存储器中,则不能同时读存储器

        • 解决方案1:流水线停顿(stall),产生空泡(bubble)

        • 解决方案2:指令和数据放在不同的存储器中

      2. 如果读寄存器和写寄存器同时发生

        • 解决方案:前半个时钟周期写,后半个读,并且设置独立的读写口
  2. 数据冒险

    • 需要等待之前的指令完成数据的读写

      1. 一条指令需要使用之前指令的运算结果,但是结果还没有写回

        sub $t0, $s1, $s2
        add $s3, $t0, $s4 # $t0 是上一条减法指令的结果
        and $s5, $s4, $t0 #  $t0 是上上条减法指令的结果
        instruction 4
        
        • 解决方案1:流水线停顿(stall),产生空泡(bubble)
      • 软件解决方案:插入nop指令
        • 解决方案2:数据前递(Forwarding)/旁路(Bypass)
      1. 一条指令需要使用之前指令的访存结果(Load-Use Harzard)

        lw $t1, 20($t0)
        or $t2, $t1, $t5 
        
        • 解决方案:流水线停顿 + 数据前递
  3. 控制冒险

    • 需要根据之前指令的结果决定下一步的行为

      1. 尚未确定是否发生分生
      beq ...
      instruction 1
      instruction 2
      instruction 3
      
      • 解决方案1:流水线停顿(stall),产生空泡(bubble)

6. 转移指令对流水线的影响

  • 改变指令流向,破坏流水模式

  • 流水线越深,超标量数越多,转移指令带来的影响越大

  • 转移指令分类(MIPS):

    无条件转移 条件转移
    直接转移 j Target
    jal Taget
    beq rs, rt, imm16
    间接转移 jr rs
    1. 无条件直接转移(J-Type)=> 流水线不停顿

      • 目标地址计算方法:New PC = {(PC+4)[31..28], addr, 00}
      • 所需信息在取指阶段即可获得(流水线不停顿)
    2. 无条件间接转移(R-Type)=> 流水线停顿1周期

      • 译码阶段才能获得转移目标地址(流水线停顿1周期)
    3. 条件直接转移(I-Type)=> 流水线停顿1周期

      • if(R[rs] - R[rt] == 0)

        then New PC = PC + 4 + SignExt[imm16] * 4;

        else New PC = PC + 4

      • 译码阶段才能获得待比较的寄存器内容(流水线停顿1周期)

      • 执行阶段才能完成转移条件的判定(流水线停顿2周期)==优化==> 比较可以不需要ALU,在译码后的busA和busB后额外加一个比较电路,比较的结果再送回PC的更新部件,这样在译码结束就能获得转移条件的判定结果,流水线只需停顿一个周期

  • 延迟转移技术

    • 原本:

      xor $s1, $s2, $s3
      addi $t1, $t3, 1
      subi $t2, $t4, 2
      beq $t1, $t2, Next
      slt $s4, $s5, -50
      ...
      
      Next: ...
      
      • beq:停顿一个周期,有浪费,可以在这个浪费的周期内填充一条指令

      • 软件层面规定:beq之后的指令是一定会被执行的,这样就不会出现被浪费的周期,但为了不改变程序原来想达到的结果,在这个例子中,只能将xor拿下来(addi和subi的结果需要用于beq的,必须要在beq前执行)

    • 优化:

      addi $t1, $t3, 1
      subi $t2, $t4, 2
      xor $s1, $s2, $s3
      beq $t1, $t2, Next
      slt $s4, $s5, -50
      ...
      
      Next: ...
      
      • 流水线不发生停顿

7. Quiz:

  1. MIPS的五级流水线结构中,读寄存器堆是在哪个阶段完成的?<u>译码</u>
  2. MIPS的五级流水线结构中,计算访存的地址是在哪个阶段完成的?<u>执行</u>
  3. 对于典型的MIPS五级流水线处理器,按照指令执行的正常流程,beq指令的分支条件判定会在哪个阶段完成?<u>执行</u>
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容