视频:
如果本次课程对应的 Coursera 的视频打不开,可以点击下面链接
P1W6U6.3 -The Assembly Process-Handling Symbols
上节课讲了 A指令 和 C指令 如何处理。
这几课来讲 Symbols 该如何处理,因为没它们帮忙,我们写HACK的汇编语言时,的确有点麻烦。
Symbols 有三种
如下图中红色
1、variables (例如:@i、@sum)
设置变量,之后程序中会往变量里赋值。
但是变量在内存中的地址,其实是由 汇编器 来分配的。编程的人并不用关心。
2、labels(例如:(LOOP)、(STOP)、(END))
(LOOP)把下一行指令的地址存在 LOOP
@LOOP 把LOOP的地址写入A寄存器,以便下一行指令计算比较后,进行jump跳转。
3、pre-defined symbols(例如:R0、R1、Screen、Keyboard)
汇编器根据 HACK的硬件结构 提前提供的一些“variables”。
先从简单的pre-defined symbols ,一个一个讲解如何处理 三种符号。
处理 pre-defined symbols
pre-defined symbols 在HACK 的 汇编语言里 共设置了 23个,如下图红框里。
而且这种 pre-defined symbols 只会出现在 A指令中,也就是在@后面出现。
所以处理这种符号,只需要简单的用它们对应的十进制数替换就好了。
然后处理的方式就和无符号A指令一样了。
处理 labels
labels 主要是 用来程序跳转时,识别跳转位置的,而且明显labels存储的地址都是程序存储区(program memory)里的地址。
用括号()设置跳转地址。这是一个伪指令(pseudo-command),所以左边图里可以看出它和 white space (空行、注释)都是没有指令行号的。至于为什么用(),那是老师规定的。。。后面可能会解释
如下图红框內, LOOP 和 STOP 、END 存储的是它们下一行的指令的地址,所以翻译时只需要把 它们 和 红框內对应地址替换就可以了。
处理 variables
那么除了 pre-defined、(XXX)两种情况,那就是variables了。
如果汇编器第一次遇见 变量:
variable 会被分配一个存储地址,地址是从16开始的,为什么是16,老师规定的,所以如果程序里先出现@i ,那么 i 变量就会被分配到存储地址16的位置上。 之后例如又遇见@sum,那么 sum 就会分配到 存储地址为17的寄存器上。而且第一次出现的变量指令后,会紧跟着给变量赋值(例如下图@i 后M=1)。
如果第二次遇见 变量:
那么就会从第一次分配的存储地址里,取出对应赋的值。
可以看出在处理这三种符号时,都用到了一个 对应表
Symbol Table
这个Symbol Table 由汇编器维护,在翻译的过程中使用:
Symbol Table 应该是用后面老师编写汇编器时用的高级语言创建的一个键值表。
这个表一开始会提前添加好 pre-defined 符号,如下图 Initialization部分。
然后汇编器 会扫描两次汇编程序。
第一次,会通过()来在 Symbol Table 中添加 Label 符号。
第二次,如果扫描到符号,如果没有在 Symbol Table 中,那就只可能是Variables 符号了。
这样在翻译时,汇编器就可以用真正的值把汇编程序中的符号,全部替换掉,这样翻译汇编语言,就变成上节课见过的逻辑了。
汇编器 工作全流程 总结
如下图,基本上就是编写汇编器时,高级语言的整个逻辑了。。。
因为基本上就是之前提到的每一个分部的总和,所以看下图熟悉一下吧。
那么接下来的课程里,老师就要用 java 或者 python 来编写这个 汇编器了。