1. MIPS指令系统从不同维度的划分
1.1 从功能维度划分
<1> 运算指令
<2> 访存指令
<3> 分支指令
1.2 从格式维度划分
<1> R型指令
<2> I型指令
<3> J型指令
2. 运算指令且R型指令的典型 - 加法指令addu
addu rd,rs,rt 该指令实现的功能是rd = rs+rt
该加法指令的指令格式如下图所示,
减法指令subu和addu非常类似,因此都以addu指令为例进行分析,看加法指令的控制信号如何给。
2.1 加法指令的操作步骤
<1> 从指令存储器取回指令
<2> 执行加法操作,R[rd] = R[rs] + R[rt]
<3> 计算下一条指令的地址,因为加法指令是顺序执行的,因此PC = PC+4
2.1.1 取指
Instruction = MEM[PC]
从指令存储器中取回指令
所有指令都有这个步骤
取指这个步骤是在IFU中完成的,如下图所示,
取指的时序如下图所示,假设在t0这个上升沿取指,一些延迟后,PC寄存器的输出稳定,再过一定时间延迟后到达下图红色虚线位置,指令存储器的输出稳定,完成了取指操作。
2.1.2 执行加法运算
首先要取得操作数,操作数所在的寄存器编号是放在指令编码中的,可以根据加法指令的位域分布从IFU取出的32-bit指令编码中,输出操作数所在寄存器的编号,如下图所示,
rs、rt、rd分别连接在数据通路相应的位置,现在再把笔记11中建立的数据通路放在这里方便分析。回忆寄存器堆的特性,当寄存器堆的Ra和Rb改变时,busA和busB会立刻输出相应的数据(有一定的电路延迟),即不受时钟信号控制。
为了实现加法操作,那么控制信号应该为,
<1> nPC_sel = "+4",即PC寄存器加4,顺序执行
<2> ALUSrc = 0,即选择busB上的数据作为ALU的第二个输入
<3> ExtOp = X,因为ALUSrc = 0,因此扩展部件的输出已经没有意义了,扩展部件执行零扩展还是符号扩展我们都不关心
<4> ALUCtr = "ADD",让ALU执行加法操作
经过一段时间延迟后,ALU输出了加法结果,根据数据通路图,ALU的输出连接在一个数据存储器的地址输入端上和一个2选1多路器上,addu指令不访问数据存储器,因此输出存储器的写使能必须为0,否则下个时钟沿,数据存储器会采样busB上的数据并改变数据存储器的内容。另外,数据存储器和寄存器堆一样,Adr输入端改变,经过一段电路延迟后,就会输出数据存储器内对应地址的数据,不受时钟控制,因此,后面的2选1多路器必须选择ALU的输出而不是数据存储器的输出,
<5> MemWr = 0
<6> MemtoReg = 0
现在ALU的输出会被送到寄存器堆的busW上,即写数据输入端口,必须将寄存器堆写使能置有效,且选择rd作为写回寄存器,这样下个时钟上升沿来时,就可以将加法结果写入rd
<7> RegWr = 1
<8> RegDst = 1
这时考虑电路延迟,时间已经过去了一小段,如下图所示,
再过一定延迟,寄存器堆的busW信号稳定,下一个时钟沿即t1到来时,寄存器堆就可以正确采样busW上的数据,并写入rd指定的寄存器,这样就完成了这一步操作。
2.1.3 更新PC寄存器的内容
PC = PC+4
除了分支指令,其他指令都要执行这个步骤。
我们要注意,IFU和数据通路的电路是同步执行操作的,当数据通路进行加法操作时,IFU也在同时进行更新PC的操作,这里控制信号已经在2.1.2的<1>给出,即nPC_sel = "+4",在下一个时钟上升沿即t1到来前,PC的输入端的信号已经稳定,这样,t1到来,PC就能正确更新。
再过一定延迟,PC+4对应的指令就又被取出,这样取指 - 执行 - 再取指 - 再执行,每条指令都会得到执行,且每条指令都在一个时钟周期内完成。
3. 运算指令且I型指令的典型 - ori指令
首先来看ori指令的格式,
3.1 ori指令执行步骤
<1> MEM[PC] 从指令存储器中取回指令
<2> R[rt] = R[rs] | ZeroExt[imm16] 指令指定的操作
<3> PC = PC+4 顺序执行
可以看出,第<1>步和第<3>步和addu指令是一样的,直接看第<2>步。
控制信号应该这样给出,
<1> nPC_sel = "+4"
<2> ALUSrc = 1,这里与addu不同,ori指令选择立即数为ALU的第二个输入
<3> ExtOp = "zero",扩展部件对imm16应该进行零扩展
<4> ALUCtr = "OR",ALU执行or运算
<5> MemWr = 0,因为这条指令不需要写数据存储器
<6> MemtoReg = 0,选择ALU的运算结果送到寄存器堆的写数据输入端口
<7> RegWr = 1,寄存器堆的写使能有效
<8> RegDst = 0,这里与addu不同,ori的写回寄存器由rt字段指定
这样,我们就可以在1个时钟周期内完成ori指令的操作。