说到汇编语言,首先想到的可能就是那看起来很奇怪的三个字符组成的各种指令了。这里就用几个篇幅的时间来学习下汇编最基础的指令系统。
在学习具体指令之前,我们来了解下最具代表性的数据处理指令的格式:
<opcode>|{<cond>}{S} <Rd>, <Rn>, <shifter_operand>
编译程序就是参照这个分类将不同意义的符号翻译成位数不定的二进制填充到一条位数为32的字中:
| 31-28 | 27-25 | 24-21 | 20 | 19-16 | 15-12 | 11-0|
| ------------- |:-------------:|:-----:|:-----:|:-----:|:-----:|:-----:|
| cond | 001 | opcode | S | Rn | Rd | shifter_operand|
下面来解释下这几个符号各自代码的意义。
- <opcode>:指令助记符,也就是人类容易记住的那三个字符组合,如mov/add/sub等。
- {<cond>}:表示指令的执行条件,条件满足时,该条指令才会执行,不满足,该条指令相当于一条nop指令,只占用指令执行时间片断,不进行任何操作。这里列举下汇编中存在的条件码,不需要记忆,用到时查询下,久了自然能够记住了。
条件码 | 条件码助记符 | 含义 | CPSR中条件标志位值 |
---|---|---|---|
0000 | EQ | 相等 | Z=1 |
0001 | NE | 不相等 | Z=0 |
0010 | CS/HS | 无符号数大于/等于 | C=1 |
0011 | CC/LO | 无符号数小于 | C=0 |
0100 | MI | 负数 | N=1 |
0101 | PL | 非负数 | N=0 |
0110 | VS | 上溢出 | V=1 |
0111 | VC | 没有上溢出 | V=0 |
1000 | HI | 无符号数大于 | C=1且Z=0 |
1001 | LS | 无符号数小于等于 | C=0且Z=1 |
1010 | GE | 有符号数大于等于 | N=1且V=1 或者 N=0且V=0 |
1011 | LT | 有符号数小于 | N=1且V=0 或者 N=0且V=1 |
1100 | GT | 有符号数大于 | Z=0且N=V |
1101 | LE | 有符号数小于等于 | Z=1或N!=V |
1110 | AL | 无条件执行 | — |
- {S}:表示该条指令是否影响CPSR的值,这里说的CPSR就是前面寄存器篇里说的状态寄存器。如果一条指令没有用这个S符号,就表示该指令的结果不会对CPSR造成任何影响,因此MOV与MOVS是有区别的哦。
- <Rd>:表示目标寄存器,指令执行的结果要保存到该寄存器中
- <Rn>:表示包含第一个操作数的寄存器。
- <shifter_operand>:表示第2个操作数,它存在着立即数、寄存器、寄存器移位等三种数据形式。
这里用数据处理指令作为一个例子来说明汇编语言是如何编译成计算机可识别的二进制数据的:每一条汇编指令都有着自己独特的格式定义,它的长度固定为32位,一个字的长度,它的一些位按照一定的规则组合在一块表示不同的意思,有的表示执行条件,有的表示操作对象。