1、基础知识
1、API & ABI
API(Application Programming Interface):应用程序编程接口。源代码和库之间的接口。
ABI(Application Binary Interface):应用程序二进制接口。应用程序与操作系统之间的底层接口,涉及的内容有:目标文件格式、数据类型的大小\布局\对齐、函数调用约定等等。
2、LLVM 编译器
作用:编译器分为前端和后端。
前端:词法分析等。
后端:生成对应平台的二进制代码及二进制代码的优化。
编译流程
Swiftc 操作
生成语法树:swiftc -dump-ast main.swift
生成最简洁的 SIL 代码:swiftc -emit-sil main.swift
生成 LLVM IR 代码:swiftc -emit-ir main.swift-omain.ll
生成汇编代码:swiftc -emit-assembly main.swift-omain.s
2、汇编
1、程序的本质
通常,CPU 会先将内存中的数据存储到寄存器中,然后再对寄存器中的数据进行运算。
2、寄存器与内存
操作实例一:
假设内存中 i 内存空间的值是 3,现在想把它的值加 1,并将结果存储到 j 内存空间。
1、CPU 首先会将 i 内存空间的值放到 rax 寄存器中:movq
i内存空间
, %rax
2、让 rax 寄存器与 1 相加:addq
$0x1
, %rax
3、将值赋值给 j 内存空间:movq
%rax
, j内存空间
操作示例二:
将寄存器 BX 的内容送入寄存器 AX
机器语言:1000100111011000
汇编语言:movw %bx, %ax
高级语言:ax = bx;
3、编程语言发展过程
高级语言 --> 汇编语言 --> 机器语言 --> 计算机
1、汇编语言与机器语言一一对应,每一条机器指令都有与之对应的汇编指令。
2、汇编语言可以通过编译得到机器语言,机器语言可以通过反汇编得到汇编语言。
3、高级语言可以通过编译得到汇编语言\机器语言,但汇编语言\机器语言几乎不可能还原成高级语言。
4、汇编语言种类
8086汇编(16bit)、x86汇编(32bit)、x64汇编(64bit)、ARM汇编(嵌入式、移动设备)。
iOS 模拟器使用的是AT&T汇编,iOS 真机使用的是ARM汇编。
5、常见汇编指令
6、寄存器
常用16寄存器
rax、rbx、rcx 、rdx、rsi、rdi、rbp、rsp、r8、r9、r10、r11、r12、r13、r14、r15
经验
1、rax、rdx 常作为函数返回值使用。
2、rdi、rsi、rdx、rcx、r8、r9 等寄存器常用于存放函数参数。
3、rsp、rbp 用于栈操作。
4、rip 作为指令指针:存储着 CPU 下一条要执行的指令的地址,一旦 CPU 读取一条指令,rip 会自动指向下一条指令(存储下一条指令的地址)。
7、LLDB 常用指令
读取寄存器的值: register read/格式 (例:register read/x)
修改寄存器的值: register write 寄存器名称 数值 (例:register write rax 0)
读取内存中的值: x/数量-格式-字节大小 内存地址 (例:x/3xw 0x0000010)
修改内存中的值: memory write 内存地址 数值 (例:memory write 0x0000010 10)
格式: x是16进制,f是浮点,d是十进制
字节大小
b – byte - 1字节
h – half word - 2字节
w – word - 4字节
g – giant word - 8字节
expression 表达式: 可以简写为 expr 表达式
例:(注:此处的 \ 为转义字符,实际中不带 \ 符号)
expression $rax
expression $rax = 1
po 表达式: po/x $rax
thread step-over、next、n:单步运⾏,把子函数当做整体⼀步执⾏(源码级别)
thread step-in、step、s:单步运⾏,遇到子函数会进⼊子函数(源码级别)
thread step-inst-over、nexti、ni:单步运⾏,把子函数当做整体⼀步执⾏(汇编级别)
thread step-inst、stepi、si:单步运⾏,遇到子函数会进⼊子函数(汇编级别)
thread step-out、finish:直接执⾏完当前函数的所有代码,返回到上一个函数(遇到断点会卡住)
规律
内存地址格式为:0x4bdc(%rip),一般是全局变量,全局区(数据段)
内存地址格式为:-0x78(%rbp),一般是局部变量,栈空间
内存地址格式为:0x10(%rax),一般是堆空间