在高级语言中,函数调用很简单,直接调用并传入相关的参数即可。在汇编语言中除了传参外,还要有当前数据入栈、申请新函数使用栈等过程。在具体介绍前,有必要了解下汇编中的栈。
栈
栈是存放局部变量的一组连续的内存空间,这段连续空间的大小是由sp/fp指针来确定的。fp是栈底指针,标志着栈的底部,sp是栈顶指针标志着栈的顶部。ARM中栈是由高地址向低地址增长的,因此sp位于低地址且随着栈的大小变更而浮动变化,而fp位于高地址,其值固定不变直至新栈建立。
入栈
下面是一段点型的函数调用时入栈的代码:
stp x22, x21, [sp, #-0x30]!
stp x20, x19, [sp, #0x10]
stp x29, x30, [sp, #0x20]
add x29, sp, #0x20
mov x21, x2
第一条指令执行前,栈中情况如下图,fp/sp分别指向函数A的栈底与栈顶,栈中保存着A函数执行时所用到的变量数据。
此时通过lldb打印sp值为:
接着函数A调用函数B,上面的汇编执行第一条指令后,栈中情况如下:
这条指令首先将x21/x22推入栈中,然后再将sp值减去0x30后重新赋给sp,即sp递减6个字节,栈大小增长了6字节。指令中"!"意味着指令执行完毕后更新基址寄存器的值,更新算法为:
基址寄存器值(执行后)=基址寄存器值(执行前)+地址偏移量
第二条指令将x19/x20推入到栈的sp+0x10位置,这与高级语言中栈的先入后出概念好像不一致!这条指令没有"!"后缀,SP也就不会发生移动。lldb打印SP值见下图,可以看出其正好减小了48,即6个字节大小。
第三条指令将x30/x29推入栈的sp+0x20位置。x29寄存器实际上就是fp寄存器,x30寄存器是lr,它标识着FuncA执行的最后一行指令的下一条指令,即跳转FuncB指令的下一条指令。将这两个寄存器保存起来,待从FuncB返回到FuncA时便可重新恢复。
第四条指令将sp加上0x20后赋给x29寄存器,这样fp就从FuncA栈的底部移到了FuncB栈的底部,也标志着FuncB栈的正式建立。
[图片上传失败...(image-53d6e6-1514447055039)]
从这里可以看到,fp与sp大小相差32即4个字节大小,这正是上面推断的大小。也可以看出x29的值与fp的值是一致的。x30的值表示是返回FuncA断续执行指令的地址,在出栈时可以验证。
出栈
接着来看FuncB的出栈代码:
ldp x29, x30, [sp, #0x20]
ldp x20, x19, [sp, #0x10]
ldp x22, x21, [sp]!, #0x30
ret
第一、二条指令是从栈的对应位置将数据读取到相应寄存器中,这里与入栈的顺序正好相反,是不是高级语言里的先入后出呢!但对ldp/stp汇编指令来说,没有这种约定的。汇编只认地址,只要地址正确,它就可以从这个地址读取出数据来。也就是说栈的这个规矩是对上层语言来说的,也可以认为是给程序员定的。
执行完第一条指令后,x29/fp重新指向了FuncA的原栈底,x30/lr寄存器重新指向FuncA调用FuncB指令的下一指令。
执行完第二条指令,寄存器x20/x19恢复原有值,可能在FuncA的后续执行指令中使用。此时整个栈如下:
第三条指令继续恢复x21/x22值之外,还将sp的值恢复了,这里的sp值与入栈是第一次打印sp值是完全一致的。此时整个栈都恢复到了调用FuncB之前的情形。
第四条指令是返回指令,它配合着x30/lr指令回到FuncA中继续执行,0x100f17a88的十进制数正是4310792840。
总结
函数调用入栈与出栈保持平衡,对于汇编来说,栈不是一个特殊的数据结构,只是存储数据的容器。