安大大 + 原创作品转载请注明出处 + 《Linux操作系统分析》MOOC课程
计算机是如何工作的:
cpu通过总线与内存相连。cpu中有一个非常重要的寄存器IP(Instruction Pointer),IP指向内存当中的代码段。cpu不断的从IP指向的内存地址取来一条指令执行,然后自加1,执行下一条指令。计算机就是如此反复不断的执行下一条指令而工作的。
实验:
首先在目录下新建一个文件
$ vi main.c
把如下的代码粘贴进去:
使用 gcc -S -o main.s main.c -m32 命令,将main.c编译成汇编代码。-m32是把main.c编译成一个32位的汇编代码。
命令执行结束后,该目录下会生成一个main.s文件,即为得到的汇编代码。".s"是汇编代码的扩展名。使用 $ vi main.s 命令打开这个文件:
其中以点开头的是用于链接时的辅助信息,不会在实际中执行,删除这些以点开头的内容,留下来纯汇编的代码。
得到的汇编代码,其中包括三个函数,main,f,g,与c语言代码分别对应。
ebp指向堆栈的栈底,esp指向堆栈的栈顶。函数调用堆栈是由逻辑上多个堆栈叠加起来的,栈底是相对的栈底。当前函数有它自己的堆栈,和相对的栈底。跳出当前函数之后另一个函数还有自己的堆栈和栈底。
eax用于暂存一些数值。函数的返回值默认使用eax寄存器存储返回给上一级函数。
执行过程:
为了方便,把地址设为标号,初地址为标号0,压一次栈为1,两个标号之间相差4个字节,低标号是高地址,高的标号是低地址。起初ebp和esp都设为0(相对的)。程序是从main函数开始的,所以刚开始eip指向main标号的位置,行号17。
标号的第一条指令就是18 pushl %ebp
下一条指令:19 movl %esp, %ebp:esp赋给ebp:
20 subl $4, %esp:$开头为立即数,esp向下减4,即向下移动一个标号:
21 movl $7, (%esp) :把立即数7放到%esp指向的位置(标号2的位置):
22 call f:call f 相当于pushl %eip,然后movl f %eip。当执行call这个动作的时候,实际上eip指向的是call的下一条指令23行。所以push进栈的是23。esp指向3,eip跳转到f:标号的位置第8行。
9 pushl %ebp:此时ebp指向标号1,所以把1压栈
10 movl %esp, %ebp:
11 subl $4, %esp:
12 movl 8(%ebp), %eax:ebp变址寻址加8,向上加两个标号的位置,它的内容是7,eax=7:
13 movl %eax, (%esp):把eax放到esp的位置:
14 call g:相当于pushl %eip,然后movl g %eip。eip指向的是call的下一条指令15行,所以压入15。eip跳转到g:标号的位置第1行。
2 pushl %ebp:
3 movl %esp, %ebp:
4 movl 8(%ebp), %eax:ebp变址寻址加8,向上加两个标号的位置,它的内容是7,eax=7
5 addl $4, %eax:把立即数4加到eax,eax=7+4=11,eax=11
6 popl %ebp:把esp里的内容放到ebp里,然后esp向上移动4,即1个标号。效果是ebp又指向了原来标号4的位置:
7 ret:ret就是popl %eip,执行之后eip指向了第15行,即call g的下一行:
15 leave:leave是先movl %ebp,%esp然后popl %ebp,记得pop之后esp上移一个标号:
16 ret:即popl %eip,esp向上移动一位,同时eip指向了23,程序跳转到执行第23行,即call f的下一条指令:
23 addl $2, %eax:eax=11+2=13,eax存储了默认的返回值。
24 leave:先movl %ebp,%esp再popl %ebp:
这个时候,栈回到了main函数最初的状态。
25 ret:return到了main函数之前的堆栈了,可能再main函数之前还有一个eip,这些由操作系统管理。
整个过程堆栈先是向下增长,然后向上还原,堆栈增增减减,把程序变成了指令流,从cpu上流了一遍。
总结
计算机的工作就是cpu就是不断的通过ip从内存当中取出指令,解释并执行的。C语言中的if else、函数调用、return等,对应着汇编当中的conditional JMP、CALL、RET等。通过这些指令来控制程序的流程,ip指针的跳转。函数调用时,会把先前的堆栈(包括信息、状态)保存下来,然后再在其上叠加一个新的堆栈。当被调用的函数执行完后,这个新的堆栈将会弹出,返回到上一层的函数堆栈,还可以得到之前堆栈当中保存的信息、状态。在这个过程当中,eip、ebp、esp、eax等寄存器不断的变化,堆栈不断的增减,整个程序变成指令流,从cpu上流过。这是我对计算机如何工作的理解。