每天一道CTF,日积月累,期待进步!
符号执行工具Angr在CTF中的应用
符号执行
概念及原理介绍
符号执行是程序分析的一种思路,可以类比解方程:我不知道该怎如何确定输入(或感兴趣的变量等)和程序执行路径之间的关系,但我可以把输入设为变量x(此为“符号”),然后对照纸面上的程序,每执行一步,我就记录下来它执行的条件(此为“执行”),作为方程的一部分。如果碰到分支语句,就分为两个方程,一个方程对应一个分支执行条件。如此等到程序结束,我就有了一堆方程,每个方程对应一个执行路径。想分析哪个路径,解对应的方程就行了。通过这样的分析技术,就可以获得让特定区域执行的输入。
符号执行技术是一种白盒的静态分析技术。符号执行(symbolic execution)本身是静态的,因为它只是把具体的输入值(input value)用符号值(symbolic value)替换,然后根据符号值的的约束条件在约束求解器(constraint solver)允许的条件下求解出满足条件的输入值。如果把上述最终状态属性替换成程序形成的bug状态,比如,存在数组越界复制的状态,那么,我们就能够利用此技术挖掘漏洞的输入向量了。
左边的代码中,testme()函数有3条执行路径,组成了右图中的执行树。直观上来看,我们只要给出三个输入就可以遍历这三个路径,即图中绿色的x和y取值。符号执行的目标就是能够生成这样的输入集合,在给定的时间内探索所有的路径。
符号执行通过维护符号状态和路径约束,以便在运行过程中传递信息。
- 符号状态(symbolic state):符号执行维护一个符号状态σ,将变量映射到符号表达式。
- 符号路径约束(symbolic path constraint):符号路径约束PC,它是符号表达式上无量词的一阶公式。
- 在执行开始时,将σ初始化为一个空映射,将PC初始化为true;
- 在符号执行过程中,σ和PC都会更新。
- 在沿着程序执行路径的符号执行结束时,使用约束求解器对PC进行求解,以生成具体的输入值。 如果程序在这些具体的输入值上执行,它将采用与符号执行完全相同的路径,并以相同的方式终止。
对于样例代码,具体的过程如下
初始化:初始化符号状态σ为空,符号路径约束PC为true;
在每个赋值v = e处,符号执行都通过将 v 映射到σ(e)来更新σ,该映射是通过对当前符号状态求值, 而获得的符号表达式。 例如:
- main()函数的前两行(第16-17行)的符号执行导致σ= {x ↦x0,y ↦ y0},其中x0,y0是两个初始不受约束的符号值;
- 在执行第6行之后,σ = {x ↦x0,y ↦y0,z ↦ 2y0}。
对于每个条件语句:if(e) then S1 else S2。
- 在第7行之后,分别创建了两个符号执行实例,分别具有路径约束x0 = 2y0和x ≠ 2y0;
- 在第8行之后,分别创建两个具有路径约束的符号执行实例(x0 = 2y0)∧(x0 > y0 + 10)和(x0 = 2y0)∧(x0 ≤ y0 + 10)。
- “then”分支: PC被更新为PC ∧ σ(e);
- “else”分支: 生成一个新的PC’, PC’被初始化为:PC∧¬ σ(e);
- 如果分支的状态σ的PC可满足,则符号执行沿着分支继续,否则路径终止。
例如:
如果一个符号执行实例碰到了exit或error时,当前符号执行实例就会被终止,并利用一个现成的约束求解器来生成一个可满足当前路径约束的赋值。 例如:
- 三条路径按照约束求解后,分别得到我们期望的三组输入:{x=0, y=1},{x=2, y=1}和{x=30, y=15}。
若代码中包含循环或递归结构,且它们的终止条件是符号化的,则可能导致有无穷多条路径。在实践过程中,需要对路径搜索设置一个限制,例如timeout,限制路径数量,循环迭代次数或探测深度。
经典的符号执行有一个关键的缺点,若符合执行路径的符号路径约束无法使用约束求解器进行有效的求解,则无法生成输入。
CTF_Angr
angr是一个基于python的二进制漏洞分析框架,它将以前多种分析技术集成进来,它能够进行动态的符号执行分析(如,KLEE和Mayhem),也能够进行多种静态分析
基本思路:
①.新建一个Angr工程,并且载入二进制文件
②.创建程序入口点的state
③.将要求解的变量符号化
④.创建SimulationManager进行程序执行管理
⑤.搜索满足我们目标的state
⑥.求解程序执行到state时,符号化变量所需要的约束条件
⑥.解出约束条件,获得目标值
github: https://github.com/jakespringer/angr_ctf. 可以看到有每一个题目的文件夹(题目生成包,用来生成可执行文件,只需刷题的话大概没用),还有dist和solutions两个文件夹。
dist
里有:
XX_xxxx
:每道题的elf。scaffoldXX.py
:解题脚本挖空范例(题面,需要填空,注释用来解释语句的作用很详细)。
solutions
里各道题的文件夹里有:
XX_xxxx
:每道题的elf。scaffoldXX.py
:解题脚本挖空范例(同上)。solveXX.py
:解题脚本(正确答案=v=)。
这里面都是典型的angr使用方法,这里仅以第一个范例进行演示,剩下的可以按照相同的思路求解。
0X00-angr_find
使用IDA打开dist/00_angr_find,F5转化为伪C代码
程序输入password,经过complex_function函数处理,如果最终等于“JACEJGCS”就输出Good Job。complex_fuction函数判断了输入的取值范围。
本题使用传统的“爆破”方法也可以解决,一位一位拼出符合题意的输入(“JXWVXRKX”)。脚本如下:
str1 = "JACEJGCS"
flag = ""
def complex_function(a1,a2):
return (3 * a2 + a1 - 65) % 26 + 65
if __name__ == "__main__":
for i in range(len(str1)):
for j in range(64,90):
if ord(str1[i]) == complex_function(j,i):
flag += chr(j)
break
print(flag)
知道目标输出,构造合适的输入,可以使用Angr这个符号执行工具解题。
①.新建一个Angr工程,并且载入二进制文件
path_to_binary = 'D:\WinAFL\angr_ctf\dist\00_angr_find'
project = angr.Project(path_to_binary, auto_load_libs=False)
②.创建程序入口点的state
state = p.factory.entry_state(add_options={angr.options.SYMBOLIC_WRITE_ADDRESSES})
③.将要求解的变量符号化
本题目中可以省略这步操作(当然也可以保留,但后面就不能用dump,要用eval),因为不是手动设置的输入,是在程序运行时用户任意输入的。
详细解释见下“注”。
u = claripy.BVS("u", 8)
initial_state.memory.store(0x080485C7, u) //main地址
④.创建SimulationManager进行程序执行管理
sm = p.factory.simulation_manager(state)</pre>
⑤.搜索满足我们目标的state
目标state是"good job", IDA中确定地址为0x8048678
print_good_address = 0x8048678
⑥.求解程序执行到state时,符号化变量所需要的约束条件
sm.explore(find=print_good_address)
⑥.解出约束条件,获得目标值
solution_state.posix.dumps(0)
代表该状态执行路径的所有输入
solution_state.posix.dumps(1)
代表该状态执行路径的所有输出
if sm.found:
solution_state = sm.found[0]
print(solution_state.posix.dumps(0))
else:
raise Exception('Could not find the solution')
完整代码见 "./angr_ctf/solutions/00_angr_find/solve00.py"
, 与爆破得到的结果一致。
注:本题中不是手动设置的输入,而是程序运行过程中进行的输入,因此可以使用dump(0) dump标准输入来得到输入。但如果题目修改为char s1[9]="00000000"
,并去掉scanf,这时就要将输入符号化,使用angr求解器(solver)提供的eval函数,得到满足条件的可能的输入。
solver.eval()函数详细说明:
https://blog.csdn.net/doudoudouzoule/article/details/79394447
baby-re(DEFCON 2016 quals)
github:https://github.com/angr/angr-doc/tree/master/examples,这里有很多例子,之前已经实践过sym_write,这次选择一个复杂点的,defcon2016quals_baby-re,作为一道经典的CTF真题,《从0到1 CTFer成长之路》一书也对这个例子进行了详细的分析。
首先IDA打开二进制文件,F5查看C伪代码,了解程序逻辑。输入13个字符,然后通过CheckSolution判断输入字符是否满足约束条件。(截图为部分程序代码)
分析可知成功的地址是0x4028E9,失败的地址是0x402941
然后用最朴素的方式构造payload,代码如下:
import angr
import claripy
import re
import math
proj = angr.Project('./baby-re', auto_load_libs=False)
state = proj.factory.entry_state(add_options={angr.options.SYMBOLIC_WRITE_ADDRESSES})
sm = proj.factory.simulation_manager(state)
sm.explore(find=0x4028E9, avoid=0x402941)
if sm.found:
solution_state = sm.found[0]
text = solution_state.posix.dumps(0).decode("utf-8") #bytes转化为string
str = re.findall(r'.{%d}' % int(10), text) #每10位进行切割,asc码转字符串,拼接组成flag
flag = ''
for i in str:
flag += (chr(int(i)))
print(flag)
else:
raise Exception('Could not find the solution')
程序输出正确的结果,但用时较长,下面要想办法优化。
-
LAZY_SOLVES
在LAZY_SOLVES打开的情况下,只要路径在基本块的末尾分支为几个,angr就不会主动检查每个成功的状态是否可以满足。相反,angr认为他们都是可以满足的,并且继续创造成功的路径。LAZY_SOLVES指在不运行的时候检查当前的条件是否能够成功到达目标位置。这样无法避免一些无解的情况,但是可以显著提高脚本的运行速度,是在路径爆炸(创建更多路径)和花费在约束求解上的时间之间的平衡。
在早期angr版本中默认LAZY_SOLVES是开启的,它可以加快我们分析的速度,因为它不会对每个状态都进行判断。新版本可通过下面的语句开启:
sm.one_active.options.add(angr.options.LAZY_SOLVES
经过实践,时间大大缩短,从449.51s降低到15.78s
-
blank_state
有些时候程序的输入数据被分类很多组,或者程序获取输入的逻辑实现的很复杂,严重干扰了angr分析,这时候就要跳过那些输入指令,加载程序,提高符号执行效率。创建
initial_state
时,使用factory的blank_state方法,传入地址,表示从该地址的状态开始,实现任意位置加载程序。
state = proj.factory.blank_state(addr=0x4025E7) #main函数地址
-
hook
在scanf函数前面存在fflush函数,它的功能是清空缓冲区,将输入写入stream。注意到在每次输入时,都会调用printf和fflush这两个对程序关键算法分析没有帮助的函数浪费时间,因此hook这两个函数,让他们直接return。
proj.hook_symbol('printf',angr.SIM_PROCEDURES['stubs']['ReturnUnconstrained'](return_value=0), replace = True)
proj.hook_symbol('fflush',angr.SIM_PROCEDURES['stubs']['ReturnUnconstrained'](return_value=0),replace = True)
优化scanf:用自己的my_scanf()
来代替__isoc99_scanf
,我们在保持scanf功能不变的情况下,将我们的符号变量存储进去。
class my_scanf(angr.SimProcedure):
def run(self, fmt, des): # 参数为 (self + 该函数实际参数)
simfd = self.state.posix.get_fd(0) # 创建一个标准输入对对象
data, real_size = simfd.read_data(4) # 从标准输入中读取一个整数,返回值第一个是读到的数据内容 第二个数内容长度
self.state.memory.store(des, data) # 将数据保存到相应参数内
return 1 # 返回原本函数该返回的东西
proj.hook_symbol('__isoc99_scanf', my_scanf(), replace=True)
# 这里%d对应int 是4个字节 但是读取到一个int所以返回1 所以这完全是模拟的原来的函数
因为我们这里Scanf是要向内存写入数据的,于是我们利用使用 state.memory.store(addr, val)
接口将数据保存到相应参数内。
优化scanf就可以达到和控制返回值类似的效果,对于速度提升效果明显,时间缩短到4.86s
-
Claripy
angr中通过claripy模块手动构造输入,claripy.BVS可以直接创建符号变量,第一个参数为变量名,第二个参数是位数,可以这样创建用户输入,然后把这些变量保存在内存地址。
class my_scanf(angr.SimProcedure):
def run(self, fmt, ptr):
self.state.mem[ptr].dword = flag_chars[self.state.globals['scanf_count']]
self.state.globals['scanf_count'] += 1
proj.hook_symbol('__isoc99_scanf', my_scanf(), replace=True)
simulation.one_active.globals['scanf_count'] = 0
这样程序每次调用scanf时,其实就是在执行my_scanf就会将flag_chars[i]存储到self.state.mem[ptr]当中,这其中ptr参数,其实就是本身scanf函数传递进来的。为了控制下标,我们设置了一个全局符号变量scanf_count记录scanf函数的数目,存储在state.globals里面,使得第i个scanf函数的state.mem赋值第i个符号变量。
这种优化方式时间缩短,效果不明显,平均5.02s
综合上述分析优化,完整程序代码见./angr-doc/examples/defcon2016quals_baby-re/solve.py
参考资料
https://blog.csdn.net/doudoudouzoule/article/details/79977415
https://b0ldfrev.gitbook.io/note/symbolic_execution/angr-jin-jie
https://www.anquanke.com/post/id/214288
https://xz.aliyun.com/t/4137
https://blog.csdn.net/doudoudouzoule/article/details/79394447
https://blog.csdn.net/zhuzhuzhu22/article/details/80350441
https://www.zhihu.com/question/53533149/answer/152262963
https://www.pianshen.com/article/5473288632/
样例来源:https://github.com/angr/angr-doc/examples/sym_write