新手第一次写, 写着玩吧. 看到这个的也当看着玩吧.
第二遍看这本书,有很多新的感悟。
本文翻译自RayW的--<苹果高级调试与反向工程>--第10章.
汇编101
wait..., 汇编是什么?
你有没有过在没有源码的函数中触发断点, 看到一堆令人恐惧的内存地址,紧随其后还跟着简短的命令? 这时你会有眉头紧锁,对自己说再也不要看到这些密密麻麻的"东西"?好吧...这些"东西"就是指令集.
下图就是在XCode模拟器中一个函数的指令集的代码跟踪(backtrace)的栗子:
查看上面的图片, 汇编可以分为几个部分. 每一条的汇编包含一个操作码(opcode).可以把它想成计算机的一个超级简单的命令.
一条操作码长啥样呢? 一个操作码是在计算机中执行一个简单任务的指令.例如, 看看下面的汇编片段:
pushq %rbx
subq $0x22, %rsp
movq %rdi, %rbx
在这一段汇编中, 你能看到三个操作码, pushq, subq 和movq. 可以把它想象成要执行的操作(action). 在操作码之后的是原地址(source label)和目的地址(destination label),操作码就是对这俩地址进行操作.
在上述例子中, 有一些是寄存器(register): rbx, rsp, rdi 和 rbp."%"在这些之前,告诉你他就是一个寄存器.
另外, 你也能看到一些16进制数字常数,例如:0x22. "$"告诉你这是一个立即数(absolute number).
现在还不需要了解这些事做什么的, 因为你要先了解函数的寄存器和调用约定(calling convention). 在接下来的章节中, 你会学到更多的操作码, 编写你自己的汇编指令.
x86_64 vs ARM64
作为苹果平台的开发者, 当你学习汇编时,你将会处理2个主要的架构: x86_64和ARM64. x86_64大多数用在macOS计算机中, 除非你运行的是古老的Macintosh.
x86_64是一个64位架构, 这就意味着每个地址由64位的1和0组成. 老式的Mac用的是32位架构, 但苹果已经在2010年底停止了对32位Mac的支持. 现在的程序几乎都运行在兼容64位的macOS和模拟器上了, 但是, 即使你的macOS是x86_64架构, 它仍可能运行32位的程序.
如果你对你所工作的硬件运行什么架构有疑问, 你可以通过终端的如下指令来获取你的硬件架构:
uname -m
ARM64架构用于手机设备,就像你的iPhone, 它有限的电量消耗是关键的问题.
ARM强调的是节约能量, 所以,相对于复杂的指令集来说, 他减少了很多指令集来帮助节省能耗. 这是一件好事, 因为在ARM架构中, 只有少量的指令集供你学习.
下面是与刚才图片相同的方法. 但是,这次使用的是ARM64的指令集:
也许现在你还不能察觉两个架构的不同, 但是你马上就能了解他们.
在很多之前的苹果iOS设备上,运行的是32位ARM处理器, 但是后来升级到了64位ARM处理器. 在许多iOS版本发布后,32位iOS设备几乎被苹果淘汰了.例如, iPhone5 就是最后一个32位的iOS设备,它已不再支持iOS11. 最低支持iOS11的设备是iPhone 5s, 他就一台64位设备.
近年, 32位设备被用在其他苹果设备中. 前两代Apple Watch就是32位设备.但是, 第三代就升级到了64位. 另外, 在最新的macOS设备中使用的Apple touch bar 还是32位架构.
由于要迎合未来学习的需求, 本书将主要关注64位指令集. 首先, 你先学习x86_64,然后, 再学习ARM64指令集, 这样你不会感觉迷惑.Well, 太迷惑.
x86_64寄存器调用约定
在运行的程序中, CPU运用一组寄存器来操作数据. 这些事存储的所有者, 就像你电脑中的RAM一样. 然而, 因为,他们在CUP中, 非常靠近需要他们的CPU的地方. 所以, 这些CPU的原件可以读写这些寄存器非常非常快.
大多数指令涉及到一个或多个寄存器, 会做一些像关于从寄存器写入到内存, 从内存中读取数据给寄存器, 或者在两个寄存器中做算术(加减等)运算的操作.
在x64(x64是x86_64的缩写, 下同)中, 有16个用于操作数据通用寄存器.
待续吧...翻译真是件辛苦的事,,,