从汇编代码理解函数调用过程

如何理解函数调用过程?本文把一个简单的C语言程序汇编成目标代码,然后用objdump目标文件反编译成的汇编代码,从而一窥函数调用过程,希望对你有所启发。
C语言源码:

#include <stdio.h>

int static add(int a, int b)
{
        return a+b;
}

int main()
{
        int x = 5;
        int y = 10;
        int u = add(x, y);

        return 1;
}
~

经过编译:gcc -g -c add.c,生成目标代码add.o
查看目标文件(生成汇编代码): objdump -d -S add.o

add.o:  file format Mach-O 64-bit x86-64

Disassembly of section __TEXT,__text:
_main:
; {                         //这是注释(ps)
       0:   55  pushq   %rbp
       1:   48 89 e5    movq    %rsp, %rbp
       4:   48 83 ec 10     subq    $16, %rsp
       8:   c7 45 fc 00 00 00 00    movl    $0, -4(%rbp)
; int x = 5;
       f:   c7 45 f8 05 00 00 00    movl    $5, -8(%rbp)
; int y = 10;
      16:   c7 45 f4 0a 00 00 00    movl    $10, -12(%rbp)
; int u = add(x, y);
      1d:   8b 7d f8    movl    -8(%rbp), %edi
      20:   8b 75 f4    movl    -12(%rbp), %esi
      23:   e8 00 00 00 00  callq   0 <_main+0x28>
      28:   be 01 00 00 00  movl    $1, %esi
      2d:   89 45 f0    movl    %eax, -16(%rbp)
; return 1;
      30:   89 f0   movl    %esi, %eax
      32:   48 83 c4 10     addq    $16, %rsp
      36:   5d  popq    %rbp
      37:   c3  retq
      38:   0f 1f 84 00 00 00 00 00     nopl    (%rax,%rax)

_add:
; {
      40:   55  pushq   %rbp
      41:   48 89 e5    movq    %rsp, %rbp         ;当前函数的栈指针
      44:   89 7d fc    movl    %edi, -4(%rbp)      ;把寄存器的参数移动到栈上
      47:   89 75 f8    movl    %esi, -8(%rbp)      ;把寄存器的参数移动到栈上
; return a+b;
      4a:   8b 75 fc    movl    -4(%rbp), %esi
      4d:   03 75 f8    addl    -8(%rbp), %esi
      50:   89 f0   movl    %esi, %eax
      52:   5d  popq    %rbp
      53:   c3  retq

从上面可以看出:
1、目标文件(.o)的地址是从0开始的 (还没有在虚拟地址空间中分配地址,ld的时候才分配)
2、函数开始地址是4字节对齐的。
3、X86架构指令长度是变长的(ARM指令是定长的4字节)。
4、名字修饰,符号名称是通过下划线+函数名得到。

程序调用过程

调用方:
  1. 先把参数保存在寄存器edi和esi中(通过寄存器传参数)
  2. 调用callq
  3. 处理返回值eax

其中,callq做了两件事情:
1) 保存下一条指令的地址,用于函数返回继续执行
2) 跳转到子函数的地址

被调用方:
  1. 上一个函数的帧指针rbp入栈
  2. 栈指针rsp保存到帧指针
  3. 从寄存器(edi和esi)取出参数到栈中
  4. 运算
  5. 把计算结果保存在eax
  6. 弹出帧指针(还原前一个函数的rbp)
  7. 函数返回,取下一跳指令继续执行

特别说明
上面函数传参和返回参数传递是通过寄存器传递的,还可以通过栈和内存区域传递,具体可以参考C语言调用惯例。

一个函数的帧结构中包含哪些数据?

1、上一个栈帧寄存器保存在栈中的值
2、本函数用的临时变量
3、调用子函数传的参数
4、调用子函数后返回时继续执行的(返回地址)

栈帧结构

栈帧示意

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 原文地址:C语言函数调用栈(一)C语言函数调用栈(二) 0 引言 程序的执行过程可看作连续的函数调用。当一个函数执...
    小猪啊呜阅读 4,759评论 1 19
  • 由于不是科班出生,又是自学开发,对很多方面的知识都是只知其然而不知其所以然。加上最近公司事情不多,刚好乘此机会把长...
    寒咯阅读 13,162评论 3 8
  • 首先寄存器使用惯例:eip :指令地址寄存器,保存程序计数器的值,当前执行的指令的下一条指令的地址值,16位中为i...
    扎Zn了老Fe阅读 2,027评论 0 0
  • 一、温故而知新 1. 内存不够怎么办 内存简单分配策略的问题地址空间不隔离内存使用效率低程序运行的地址不确定 关于...
    SeanCST阅读 7,941评论 0 27
  • 从本篇开始,我们讨论一些高级语言中的基础设施:堆栈,函数调用,变量生命周期等等话题。因为这里本身会涉及到比较多的汇...
    SlayerNux阅读 13,238评论 1 28