由段地址x16引发的讨论
“段地址x16”有一个更为常用的说法是左移4位。计算机中的所有信息都是以二进制的形式存储的,段地址当然也不例外。机器只能处理二进制信息,“左移4 位”中的位,指的是二进制位。
一个例子,一个数据为2H,二进制形式为10B, 对其进行左移运算:
观察上面移位次数和各种形式数据的关系,我们可以发现:一个数据的二进制形式左移1位,相当于该数据乘以2;
一个数据的二进制形式左移N位,相当于该数据乘以2的N次方;
地址加法器如何完成段地址x16的运算?就是将以二进制形式存放的段地址左移4位。
一个数据的十六进制形式左移1位,相当于乘以16; 一个数据的十进制形式左移1位,相当于乘以10;一个X进制的数据左移1位,相当于乘以X。
“段地址x16+偏移地址=物理地址”的本质含义
讨论的是8086CPU段地址和偏移地址的本质含义,而不是为了解决具体的问题而在本质含义之上引申出来的更高级的逻辑意义。不管以多少种不同的逻辑意义去看待“段地址x16+偏移地址=物理地址”的寻址模式,一定要清楚地知道它的本质含义,这样才能更灵活地利用它来分析、解决问题。如果只拘泥于某一种引申出来的逻辑含义,而模糊本质含义的话,将从意识上限制对这种寻址功能的灵活应用。
“段地址x16+偏移地址=物理地址”的本质含义是: CPU在访问内存时,用一个基础地址(段地址x16)和一个相对于基础地址的偏移地址相加,给出内存单元的物理地址。
8086CPU的这种寻址功能是“基础地址+偏移地址=物理地址”寻址模式的一-种具体实现方案。8086CPU中, 段地址x16可看作是基础地址。
段的概念
其实,内存并没有分段,段的划分来自于CPU,由于8086CPU用“基础地址(段地址x16)+偏移地址=物理地址”的方式给出内存单元的物理地址,使得我们可以用分段的方式来管理内存。如图所示,我们可以认为:地址10000H~ 100FFH的内存单元组成一个段,该段的起始地址(基础地址)为10000H, 段地址为1000H, 大小为100H;我们也可以认为地址10000H~ 1007FH、10080H~ 10FFH的内存单元组成两个段,它们的起始地址(基础地址)为:10000H 和10080H,段地址为: 1000H 和1008H,大小都为80H。
在编程时可以根据需要,将若干地址连续的内存单元看作一个段,用段地址x16定位段的起始地址(基础地址),用偏移地址定位段中的内存单元。有两点需要注意:段地址x16必然是16 的倍数,所以一个段的起始地址也一定是16 的倍数;偏移地址为16位,16位地址的寻址能力为64KB,所以一个段的长度最大为64KB
内存单位地址小结
CPU访问内存单元时,必须向内存提供内存单元的物理地址。8086CPU在内部用段地址和偏移地址移位相加的方法形成最终的物理地址。
CPU可以用不同的段地址和偏移地址形成同一个物理地址。
比如CPU要访问21F60H单元,则它给出的段地址SA和偏移地址EA满足SAx16+EA=21F60H即可。
如果给定一个段地址,仪通过变化偏移地址来进行寻址,最多可定位多少个内存单元?
结论:偏移地址16位,变化范围为0~FFFFH,仅用偏移地址来寻址最多可寻64KB个内存单元。比如给定段地址1000H,用偏移地址寻址,CPU的寻址范围为: 10000H~1FFFFH。
在8086PC机中,存储单元的地址用两个元素来描述,即段地址和偏移地址。
“数据在21F60H内存单元中。”这句话对于8086PC机-般不这样讲,取而代之的是两种类似的说法:1.数据存在内存2000:1F60单元中;2.数据存在内存的2000H段中的1F60H单元中。这两种描述都表示“数据在内存21F60H单元中”。
可以根据需要,将地址连续、起始地址为16的倍数的一组内存单元定义为一个段。
段寄存器
8086CPU在访问内存时要由相关部件提供内存单元的段地址和偏移地址,送入地址加法器合成物理地址。需要看一下,是什么部件提供段地址。段地址在8086CPU的段寄存器中存放。8086CPU 有4个段寄存器: CS、DS、SS、ES。当8086CPU要访问内存时由这4个段寄存器提供内存单元的段地址。
CS和IP
CS和IP是8086CPU中两个最关键的寄存器,它们指示了CPU当前要读取指令的地址。CS为代码段寄存器,IP 为指令指针寄存器,从名称上我们可以看出它们和指令的关系。在8086PC机中,任意时刻, 设CS中的内容为M,IP 中的内容为N,8086CPU 将从内存Mx16+N单元开始,读取一条指令并执行。
也可以这样表述: 8086 机中,任意时刻,CPU将CS:IP指向的内容当作指令执行。
图展示了8086CPU 读取、执行指令的工作原理(图中只包括了和所要说明的问题密切相关的部件,图中数字都为十六进制)。
8086CPU当前状态: CS中的内容为2000H,IP 中的内容为0000H;
内存20000H~20009H单元存放着可执行的机器码;
内存20000H~20009H单元中存放的机器码对应的汇编指令如下。
地址:20000H~20002H,内容: B8 23 01,长度: 3Byte, 对应汇编指令:mov ax,0123H
地址: 20003H~20005H,内容: BB 03 00,长度: 3Byte, 对应汇编指令: mov bx,0003H
地址: 20006H~ 20007H,内容: 89 D8,长度: 2Byte, 对应汇编指令: mov ax,bx
地址: 20008H~20009H,内容: 01 D8,长度: 2Byte, 对应汇编指令: add ax,bx
下面的一组图(图2.11~图2.19),以图2.10描述的情况为初始状态,展示了8086CPU读取、执行一条指令的过程。注意每幅图中发生的变化(下面对8086CPU 的描述,是在逻辑结构、宏观过程的层面上进行的,目的是使读者对CPU工作原理有一个清晰、 直观的认识,为汇编语言的学习打下基础。其中隐蔽了CPU的物理结构以及具体的工作细节)。
(读取一条指令后,IP中的值自动增加,以使CPU可以读取下一条指令。因当前读入的指令B82301长度为3个字符,所以IP中的值加3。此时,CS:IP指向内存单元 2000:0003。)
下面的一组图(图 2.20-图2.26),以图2.19的情况为初始状态,展示了8086CPU 继续读取、执行3条指令的过程。注意IP的变化(下面的描述中,隐蔽了读取每条指令的细节)。
8086CPU的工作过程简要描述如下
(1)从CS:IP指向的内存单元读取指令,读取的指令进入指令缓冲器;
(2)IP-IP+所读取指令的长度, 从而指向下一 条指 令;
(3)执行指令。转到步骤(1),重复这个过程。
在8086CPU加电启动或复位后(即CPU刚开始工作时)CS和IP被设置为CS=FFFFH, IP=0000H, 即在8086PC机刚启动时,CPU从内存FFFOH单元中读取指令执行,FFFF0H 单元中的指令是8086PC机开机后执行的第一条指令。
我们更清楚了CS和IP的重要性,它们的内容提供了CPU要执行指令的地址。
在内存中,指令和数据没有任何区别,都是进制信息, CPU在工作的时候把有的信息看作指令,有的信息看作数据。现在,如果提出一个问题: CPU根据什么将内存中的信息看作指令?如何回答?我们可以说,CPU 将CS:IP指向的内存单元中的内容看作指令,因为,在任何时候,CPU将CS、IP中的内容当作指令的段地址和偏移地址,用它们合成指令的物理地址,到内存中读取指令码,执行。如果说,内存中的一段信息曾被CPU执行过的话,那么,它所在的内存单元必然被CS:IP指向过。
修改CS、 IP的指令
在CPU中,程序员能够用指令读写的部件只有寄存器,程序员可以通过改变寄存器中的内容实现对CPU的控制。CPU从何处执行指令是由CS、IP中的内容决定的,程序员可以通过改变CS、IP 中的内容来控制CPU执行目标指令。
我们如何改变CS、IP 的值呢?8086CPU 必须提供相应的指令。我们如何修改AX中的值?可以用mov指令,如mov ax,123 将ax中的值设为123,显然,我们也可以用同样的方法设置其他寄存器的值,如mov bx,123, movex,123, movdx, 123等。其实,8086CPU大部分寄存器的值,都可以用mov指令来改变,mov指令被称为传送指令。
但是,mov 指令不能用于设置CS、IP 的值,原因很简单,因为8086CPU没有提供这样的功能。8086CPU为CS、IP提供了另外的指令来改变它们的值。能够改变CS、IP的内容的指令被统称为转移指令。
一个最简单的可以修改CS、IP的指令: jmp 指令。
若想同时修改CS、IP 的内容,可用形如“jmp段地址:偏移地址”的指令完成,如
jmp 2AE3:3,执行后: CS=2AE3H, IP=0003H, CPU将从2AE33H处读取指令。
jmp 3:0B16,执行后: CS=0003H,IP=0B16H,CPU将从00B46H处读取指令。
“jmp段地址:偏移地址”指令的功能为:用指令中给出的段地址修改CS,偏移地址修改IP。
若想仅修改IP的内容,可用形如“jmp某一合法寄存器” 的指令完成,
jmp ax,指令执行前:ax=1000H,CS=2000H,IP=00030
指令执行后: ax=100 CS=2000H,IP=1000H
jmp bx,指令执行前: bx=0B16H,CS=2000H,IP=0003H
指令执行后: bx= 0B16H,CS=2000H, IP=0B16H
“jmp某一合法寄存器” 指令的功能为:用寄存器中的值修改IP
jmp ax,在含义上好似: mov IP,ax。
我们在适当的时候,会用已知的汇编指令的语法来描述新学的汇编指令的功能。采用一种“用汇编解释汇编”的方法更好地理解汇编指令的功能,这样做有助于进行知识的相互融会。要强调的是,我们是用“已知的汇编指令的语法”进行描述,并不是用“已知的汇编指令”来描述,比如,我们用mov IP,ax 来描述jmp ax,并不是说真有mov IP,ax 这样的指令,而是用mov指令的语法来说明jmp指令的功能。我们可以用同样的方法描述jmp 3:01B6 的功能: jmp 3:01B6 在含义上好似mov CS,3 movIP,01B6。
内存中存放的机器码和对应的汇编指令情况如图2.27所示,设CPU初始状态:CS=2000H,IP=0000H,请写出指令执行序列。思考后看分析。
(1) 当前CS=2000H,IP=0000H则CPU从内存2000Hx 16+0 2000H处读取指令,读入的指令是: B8 22 66(mov x,6622),读入后IP=IP+3=0003H;
(2) 指令执行后,CS=2000H, IP=0003H则CPU从内存2000Hx16+0003H=20003H处读取指令,读入的指令是: EA 03 00 00 10(jmp 1000:0003),读入后IP=IP+5=0008H;
(3)指令执行后,CS=1000H,IP =0003H,则CPU从内存1000Hx16+0003H= 10003H处读取指令,读入的指令是: B8 00 00(mov ax,0000),读入后IP=IP+3=0006H;
(4) 指令执行后,CS=1000H,IP=0006H, 则CPU从内存1000H x 16+0006H= 10006H处读取指令,读入的指令是: 8B D8(mov bx,ax),读入后IP=IP+2=0008H;
(5)指令执行后,CS=1000H,IP 0008H,则CPU从内存1000Hx16+0008H= 10008H处读取指令,读入的指令是: FF E3(jmp bx),读入后IP=IP+2=000AH;
(6)指令执行后,CS= 1000H,IP=0000H,CPU从内存10000H处读取指令.....
经分析后,可知指令执行序列为:
(1) mov ax,6622H
(2) jmp 1000:3
(3) mov ax,0000
(4)mov bx,ax
(5) jmp bx
(6)mov ax,0123H
(7)转到第3步执行
代码段
前面讲过,对于8086PC机,在编程时,可以根据需要,将一组内存单元定义为一个段。我们可以将长度为N(N<=64KB)的一组代码, 存在一组地址连续、 起始地址为16的倍数的内存单元中,我们可以认为,这段内存是用来存放代码的,从而定义了一个代码段。比如,将:
这段长度为10 个字节的指令,存放在123B0H~4123B9H 的一组内存单元中,我们就可以认为,123B0H~123B9H 这段内存是用来存放代码的,是一个代码段,它的段地址为123BH,长度为10 个字节。
如何使得代码段中的指令被执行呢?将一段内存当作代码段,仅仅是我们在编程时的一种安排,CPU并不会由于这种安排,就自动地将我们定义的代码段中的指令当作指令来执行。CPU只认被CS:IP指向的内存单元中的内容为指令。所以,要让CPU执行我们放在代码段中的指令,必须要将CS:IP指向所定义的代码段中的第一条指令的首地址。 对于上面的例子,我们将段代码存放 在123B0H~ 123B9H 内存单元中,将其定义为代码段,如果要让这段代码得到执行,可设CS=123BH、IP=0000H。
小结
(1)段地址在8086CPU的段寄存器中存放。当8086CPU要访问内存时,由段寄存器提供内存单元的段地址。8086CPU 有4个段寄存器,其中CS用来存放指令的段地址。
(2) CS存放指令的段地址,IP 存放指令的偏移地址。
8086机中,任意时刻,CPU将CS:IP指向的内容当作指令执行。
(3) 8086CPU的工作过程:
①从CS: IP指向的内存单元读取指令,读取的指令进入指令缓冲器;
②IP 指向下一条指令;
③执行指令。(转到步骤①,重复这个过程。)
(4)8086CPU提供转移指令修改CS、IP的内容。