现在 class-dump 是非常 so easy 的一件事情,代码混淆也渐渐变成程序打包的重要一个步骤,也从不常用变为常用
为什么要代码混淆
作为一个合格的程序员,我们的方法命名是可读并有确定意义的,dump 后,“分析人员”就可根据方法名进行针对性分析,从而找到切入点,进行后续的逆向工作。而代码混淆,对于一些关键性的方法被混淆了,一定程度上加大了逆向的难度。
代码混淆的原理
其原理,实际上非常简单,就是字符串替换。在程序打包前,将当前工程中的所有文件中的特定字符串 A,替换成其他的字符串B,这样被 dump 后,还原的方法名,就变成了 B 。
需要注意的点
- 需要替换的方法名,不可为系统方法
举个例子:
将 init 方法替换成 ABC ,这样在工程里面的 [super init] ->[super ABC],但 apple 提供的 framework 里面的并没有 ABC 方法,这样的结果,就会造成混淆后,出现一堆 error.
- 要保存替换和被替换的方法名
因为当程序上线后,出现问题后,调试里面的堆栈和日志 ,方法名显示的是被替换后的方法名;
如果没有预先保存,那必须去源代码进行分析,才能具体知道这个方法是干什么的,这就加大了维护的工作量,这是需要避免的。
代码混淆的实现
这个用 shell 或者 python 都容易实现,下面我写了个简单粗暴的 shell
混淆
#! /usr/bin/env bash
TARGET_PATH="../CICodeConfuse"
function confuse(){
local string=$1
local relpaceString=$2
#替换字符串,并备份
sed -i '.bak' "s/$string/$relpaceString/g" `grep $string -rl $TARGET_PATH`
}
#替换字符串
confuse "test1Confuse" "haowanwanwan"
confuse "myConfuse" "ABC"
还原
#! /usr/bin/env bash
#将字符串还原
TARGET_PATH="../CICodeConfuse"
function reverseConfuse(){
local string=$1
local relpaceString=$2
#替换字符串,并备份
sed -i '.bak' "s/$string/$relpaceString/g" `grep $string -rl $TARGET_PATH`
}
#替换字符串
reverseConfuse "haowanwanwan" "test1Confuse"
reverseConfuse "ABC" "myConfuse"
其实,这里俩个主要方法都是一样的,就是字符串匹配并替换,当然这里只介绍最基础的,想做一个完善的代码混淆,可以对脚步进行深入优化,定义完整的规则,将相关字符串写成文件,插入数据库等
代码链接:https://github.com/Supecomer/CICodeConfuse
优化点
- 可以将程序打包,通过 shell 脚本实现,将混淆代码的 shell 写成一个完整 自动的 shell, 这样混淆对于开发人员是完全透明的,而且可以避免出错
- 替换的字符串,可以通过脚本随机生成,将要替换的字符串 A 和 替换成的字符串 B , 写成文件保存,方便后面对照
- 通过正则表达式,可以针对性的,只对方法或者类名进行混淆等,is up to you
结束语
代码的混淆并不困难,主要是避免因没有规范的命名,造成混淆后出现大量错误;当然这里是可以还原的O(∩_∩)O哈!。很多东西明白了其原理,再怎么变,也是那样,只是花样变多了而已,万变不离其宗!