12. 运算指令的控制信号

1. MIPS指令系统从不同维度的划分

1.1 从功能维度划分

<1> 运算指令

<2> 访存指令

<3> 分支指令

1.2 从格式维度划分

<1> R型指令

<2> I型指令

<3> J型指令

2. 运算指令且R型指令的典型 - 加法指令addu

addu rd,rs,rt 该指令实现的功能是rd = rs+rt

该加法指令的指令格式如下图所示，

addu rd,rs,rt的指令格式

减法指令subu和addu非常类似，因此都以addu指令为例进行分析，看加法指令的控制信号如何给。

2.1 加法指令的操作步骤

<1> 从指令存储器取回指令

<2> 执行加法操作，R[rd] = R[rs] + R[rt]

<3> 计算下一条指令的地址，因为加法指令是顺序执行的，因此PC = PC+4

2.1.1 取指

Instruction = MEM[PC]

从指令存储器中取回指令

所有指令都有这个步骤

取指这个步骤是在IFU中完成的，如下图所示，

IFU

取指的时序如下图所示，假设在t0这个上升沿取指，一些延迟后，PC寄存器的输出稳定，再过一定时间延迟后到达下图红色虚线位置，指令存储器的输出稳定，完成了取指操作。

取指的时序示意图

2.1.2 执行加法运算

首先要取得操作数，操作数所在的寄存器编号是放在指令编码中的，可以根据加法指令的位域分布从IFU取出的32-bit指令编码中，输出操作数所在寄存器的编号，如下图所示，

根据加法指令addu的指令格式，从32-bit指令编码中输出操作数寄存器编号

rs、rt、rd分别连接在数据通路相应的位置，现在再把笔记11中建立的数据通路放在这里方便分析。回忆寄存器堆的特性，当寄存器堆的Ra和Rb改变时，busA和busB会立刻输出相应的数据（有一定的电路延迟），即不受时钟信号控制。

笔记11最后，建立的数据通路

为了实现加法操作，那么控制信号应该为，

<1> nPC_sel = "+4"，即PC寄存器加4，顺序执行

<2> ALUSrc = 0，即选择busB上的数据作为ALU的第二个输入

<3> ExtOp = X，因为ALUSrc = 0，因此扩展部件的输出已经没有意义了，扩展部件执行零扩展还是符号扩展我们都不关心

<4> ALUCtr = "ADD"，让ALU执行加法操作

经过一段时间延迟后，ALU输出了加法结果，根据数据通路图，ALU的输出连接在一个数据存储器的地址输入端上和一个2选1多路器上，addu指令不访问数据存储器，因此输出存储器的写使能必须为0，否则下个时钟沿，数据存储器会采样busB上的数据并改变数据存储器的内容。另外，数据存储器和寄存器堆一样，Adr输入端改变，经过一段电路延迟后，就会输出数据存储器内对应地址的数据，不受时钟控制，因此，后面的2选1多路器必须选择ALU的输出而不是数据存储器的输出，

<5> MemWr = 0

<6> MemtoReg = 0

现在ALU的输出会被送到寄存器堆的busW上，即写数据输入端口，必须将寄存器堆写使能置有效，且选择rd作为写回寄存器，这样下个时钟上升沿来时，就可以将加法结果写入rd

<7> RegWr = 1

<8> RegDst = 1

这时考虑电路延迟，时间已经过去了一小段，如下图所示，

执行完加法操作后的时刻

再过一定延迟，寄存器堆的busW信号稳定，下一个时钟沿即t1到来时，寄存器堆就可以正确采样busW上的数据，并写入rd指定的寄存器，这样就完成了这一步操作。

2.1.3 更新PC寄存器的内容

PC = PC+4

除了分支指令，其他指令都要执行这个步骤。

更新PC

我们要注意，IFU和数据通路的电路是同步执行操作的，当数据通路进行加法操作时，IFU也在同时进行更新PC的操作，这里控制信号已经在2.1.2的<1>给出，即nPC_sel = "+4"，在下一个时钟上升沿即t1到来前，PC的输入端的信号已经稳定，这样，t1到来，PC就能正确更新。

再过一定延迟，PC+4对应的指令就又被取出，这样取指 - 执行 - 再取指 - 再执行，每条指令都会得到执行，且每条指令都在一个时钟周期内完成。

3. 运算指令且I型指令的典型 - ori指令

首先来看ori指令的格式，

ori指令格式

3.1 ori指令执行步骤

<1> MEM[PC] 从指令存储器中取回指令

<2> R[rt] = R[rs] | ZeroExt[imm16] 指令指定的操作

<3> PC = PC+4 顺序执行

可以看出，第<1>步和第<3>步和addu指令是一样的，直接看第<2>步。

从指令编码的低16位取出imm16，并连接在数据通路上，黄色高亮标识

控制信号应该这样给出，

<1> nPC_sel = "+4"

<2> ALUSrc = 1，这里与addu不同，ori指令选择立即数为ALU的第二个输入

<3> ExtOp = "zero"，扩展部件对imm16应该进行零扩展

<4> ALUCtr = "OR"，ALU执行or运算

<5> MemWr = 0，因为这条指令不需要写数据存储器

<6> MemtoReg = 0，选择ALU的运算结果送到寄存器堆的写数据输入端口

<7> RegWr = 1，寄存器堆的写使能有效

<8> RegDst = 0，这里与addu不同，ori的写回寄存器由rt字段指定

这样，我们就可以在1个时钟周期内完成ori指令的操作。

12. 运算指令的控制信号