目录
-
关于CPU的补充:
寄存器、高速缓存、寄存器的补充、浮点和向量寄存器 -
二、栈:
SP和FP寄存器、函数调用栈、关于内存读写指令、堆栈操作练习 -
三、bl和ret指令:
bl标号、b指令、ret (return)、x30寄存器
一、关于CPU的补充
寄存器
CPU除了有控制器、运算器还有寄存器。其中寄存器的作用就是进行数据的临时存储。
CPU的运算速度是非常快的,为了性能CPU在内部开辟一小块临时存储区域,并在进行运算时先将数据从内存复制到这一小块临时存储区域中,运算时就在这一小快临时存储区域内进行。我们称这一小块临时存储区域为寄存器。
对于arm64系的CPU来说, 如果寄存器以x开头则表明的是一个64位的寄存器,如果以w开头则表明是一个32位的寄存器,在系统中没有提供16位和8位的寄存器供访问和使用。其中32位的寄存器是64位寄存器的低32位部分并不是独立存在的。
高速缓存
iPhoneX上搭载的ARM处理器A11它的1级缓存的容量是64KB,2级缓存的容量8M.
CPU每执行一条指令前都需要从内存中将指令读取到CPU内并执行。而寄存器的运行速度相比内存读写要快很多,为了性能,CPU还集成了一个高速缓存存储区域.当程序在运行时,先将要执行的指令代码以及数据复制到高速缓存中去(由操作系统完成).CPU直接从高速缓存依次读取指令来执行.
寄存器的补充
数据地址寄存器
数据地址寄存器通常用来做数据计算的临时存储、做累加、计数、地址保存等功能。定义这些寄存器的作用主要是用于在CPU指令中保存操作数,在CPU中当做一些常规变量来使用。
ARM64中
- 64位: X0-X30, XZR(零寄存器)
- 32位: W0-W30, WZR(零寄存器)
注意:
之前讲解8086汇编中有一种特殊的寄存器段寄存器
:CS,DS,SS,ES四个寄存器来保存这些段的基地址,这个属于Intel架构CPU中.在ARM中并没有
浮点和向量寄存器
因为浮点数的存储以及其运算的特殊性,CPU中专门提供浮点数寄存器来处理浮点数
- 浮点寄存器 64位: D0 - D31 32位: S0 - S31
现在的CPU支持向量运算.(向量运算在图形处理相关的领域用得非常的多)为了支持向量计算系统了也提供了众多的向量寄存器.
- 向量寄存器 128位:V0-V31
二、栈
-
栈:是一种具有特殊的访问方式的存储空间(后进先出, Last In Out Firt,LIFO)
SP和FP寄存器
- sp寄存器在任意时刻会保存我们栈顶的地址.
- fp寄存器也称为x29寄存器属于通用寄存器,但是在某些时刻我们利用它保存栈底的地址!
注意:ARM64开始,取消32位的 LDM,STM,PUSH,POP指令! 取而代之的是ldr\ldp str\stp
ARM64里面 对栈的操作是16字节对齐的!!
(栈的拉伸为16字节(0x10)的倍数,栈中可进行8字节、4字节的读写)
函数调用栈
常见的函数调用开辟和恢复的栈空间(栈是从高地址往低地址
拉伸空间)
sub sp, sp, #0x40 ; 拉伸0x40(64字节)空间
stp x29, x30, [sp, #0x30] ;x29\x30 寄存器入栈保护
add x29, sp, #0x30 ; x29指向栈帧的底部
...
ldp x29, x30, [sp, #0x30] ;恢复x29/x30 寄存器的值
add sp, sp, #0x40 ; 栈平衡
ret
关于内存读写指令
注意:在内存中:读/写 数据是都是从
低地址往高地址
读/写
str(store register)指令
将数据从寄存器中读出来,存到内存中.
ldr(load register)指令
将数据从内存中读出来,存到寄存器中
此ldr 和 str 的变种ldp 和 stp 还可以操作2个寄存器.
堆栈操作练习
使用32个字节空间作为这段程序的栈空间,然后利用栈将x0和x1的值进行交换.
sub sp, sp, #0x20 ;拉伸栈空间32个字节(sp=sp-0x20)
stp x0, x1, [sp, #0x10] ;sp往上加16个字节,存放x0 和 x1(一般从栈低开始存数据,所以往上加0x10)
ldp x1, x0, [sp, #0x10] ;将sp偏移16个字节的值取出来,放入x1 和 x0
add sp, sp, #0x20 ; 栈平衡
ret
[]表示取地址中的值(寻址)、或将左边的值存到[]中的地址中去
三、bl和ret指令
bl标号
- 将下一条指令的地址放入lr(x30)寄存器
- 转到标号处执行指令
b指令
- b指令直接跳转到标号处执行指令,不会修改lr(x30)寄存器
ret (return)
- 默认使用lr(x30)寄存器的值,通过底层指令提示CPU此处作为下条指令地址!
ARM64平台的特色指令,它面向硬件做了优化处理的
x30寄存器
x30寄存器存放的是函数的返回地址.当ret指令执行时刻,会寻找x30寄存器保存的地址值!
注意:在函数嵌套调用的时候.需要将x30中的地址入栈保存!
函数嵌套调用时入栈保存lr(x30)寄存器中的地址(可参照函数嵌套调用时系统生成的汇编如何实现的)
.text
.global _A,_B
_A:
//sub sp,sp,#0x10 ;拉伸栈空间
//str x30,[sp] ;保存x30寄存器中的值
str x30,[sp,#-0x10]! ;上面两行的简写
mov x0,#0xaaaa
bl _B ;bl指令会将B的返回地址存到x30中
mov x0,#0xaaaa
//ldr x30,[sp] ;取出之前函数的返回地址并存到x30寄存器中
//add sp,sp,#0x10 ;平衡栈空间
ldr x30,[sp],#0x10 ;上面两行的简写
ret
_B:
move x0, #0xbbbb
ret
str x30,[sp,#-0x10]! :表示将值存到sp-0x10的地址,并sp-=0x10
ldr x30,[sp],#0x10:表示取出sp中的值,并sp+=0x10