[翻译]Where the top of the stack is on x86

原作者Eli Bendersky's website (https://eli.thegreenplace.net/)

背景

对软件进行逆向分析时,通常对函数堆栈空间的分析是第一步,也是重要的步骤,文章主要对x-86架构的栈空间问题进行了基础性的描述,作为初学逆向很值得学习:

The stack analogy 栈空间类比

回到基本概念,栈空间通常被比喻一推叠放起来的碟子,无论放新的盘子还是取走一个盘子,都是从这推叠放的顶端操作,因此堆栈的操作部分也成为栈顶top of stack,栈的操作也类似分为入栈push和出栈pop。


plates

Hardware stacks 实际硬件中的栈

一般来讲,栈是来自于memory的一段空间,入栈就是在把新的数据放到栈顶,而出栈就是把栈顶上的数据取走,然而这么说并没有明确究竟栈顶和memory的关系和位置。

The stack in x86

这里将解释上面困惑的原因,在于x86架构下栈的方向是“头朝下”,即从某一地址开始向低地址方向生长:


stack1

因此,我们说x86架构的栈顶值得是从memory中申请到的这段堆栈的地址的最低部分。当我们讨论它时,让我们看看x86汇编编程的一些常见习语如何映射到该图形表示形式。

Pushing and popping data with the stack pointer 通过SP指针压栈和出栈

x86架构保留以个特殊的寄存器用于栈的操作--ESP(Extend Stack Point)。SP指针的作用即一直指向栈顶:


stack2

在上图中,0x9080ABCC即是栈顶地址,esp指向的数据"foo"就位于栈顶位置。

使用“push”想栈顶压入数据,push操作首先对esp的地址值减4,并且将操作数存放到esp指向的位置,因此:
push eax 等价于

sub esp, 4
mov [esp], eax

按照之前栈结构图示中的esp位置,假设eax保存新的压栈数据0xDEADBEEF,push操作之后栈空间变为:

stack3

类似的,执行pop指令是从顶取走数据并替换其操作数,先保存栈顶位置之后地址值增加,换句话:
pop eax等价于

mov eax, [esp]
add esp, 4

接上面的栈空间结构(push操作后),pop eax后的结果为:

stack4

这样,数值0xDEADBEEF就被写入了eax,同时发现0xDEADBEEF 的地址为0x9080ABC8。

Stack frames and calling conventions 栈结构和条用规则

分析以下C编写的汇编程序,可以发现很多有趣的模式。我们关心的主要是函数的参数是如何通过过栈传入的(当然在其他的一些架构或者调用方式中,参数是放在寄存器里),以及本地参数在栈空间的分布规则。
分析以下C程序代码

int foobar(int a, int b, int c)
{
    int xx = a + 2;
    int yy = b + 3;
    int zz = c + 4;
    int sum = xx + yy + zz;
    return xx * yy * zz + sum;
}
int main()
{
    return foobar(77, 88, 99);
}

foobar函数被调用时,包括传入foobar的参数、函数的本地变量以及其他数据都将被保存到栈空间中。这一系列的数据都被称为函数的栈帧,那么在return函数执行前,foobar函数的栈帧结构为:

stackframe1

当调用函数时,首先将绿色的数据分配一段空间存储参数,蓝色的数据则是函数本身的压栈操作用于保存本地变量,使用gcc进行编译:
gcc -masm=intel -S z.c -o z.s
得到函数foobar的汇编代码,我们对其进行了注释:

_foobar:
    ; ebp must be preserved across calls. Since
    ; this function modifies it, it must be
    ; saved.
    ;
    push    ebp

    ; From now on, ebp points to the current stack
    ; frame of the function
    ;
    mov     ebp, esp

    ; Make space on the stack for local variables
    ;
    sub     esp, 16

    ; eax <-- a. eax += 2. then store eax in xx
    ;
    mov     eax, DWORD PTR [ebp+8]
    add     eax, 2
    mov     DWORD PTR [ebp-4], eax

    ; eax <-- b. eax += 3. then store eax in yy
    ;
    mov     eax, DWORD PTR [ebp+12]
    add     eax, 3
    mov     DWORD PTR [ebp-8], eax

    ; eax <-- c. eax += 4. then store eax in zz
    ;
    mov     eax, DWORD PTR [ebp+16]
    add     eax, 4
    mov     DWORD PTR [ebp-12], eax

    ; add xx + yy + zz and store it in sum
    ;
    mov     eax, DWORD PTR [ebp-8]
    mov     edx, DWORD PTR [ebp-4]
    lea     eax, [edx+eax]
    add     eax, DWORD PTR [ebp-12]
    mov     DWORD PTR [ebp-16], eax

    ; Compute final result into eax, which
    ; stays there until return
    ;
    mov     eax, DWORD PTR [ebp-4]
    imul    eax, DWORD PTR [ebp-8]
    imul    eax, DWORD PTR [ebp-12]
    add     eax, DWORD PTR [ebp-16]

    ; The leave instruction here is equivalent to:
    ;
    ;   mov esp, ebp
    ;   pop ebp
    ;
    ; Which cleans the allocated locals and restores
    ; ebp.
    ;
    leave
    ret

可以看到首先需要在内存上开辟一段栈空间,用于函数中各个参数(此函数为return, a, b, c),ebp永远指向返回地址,参战按照ebp不断增加;之后函数将本地变量(xx,yy,zz,sum)压栈。函数参数在堆栈中高于ebp(因此访问它们时为正偏移量),而局部变量在堆栈中低于ebp。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容