以前大学程序设计基础入门讲的就是如何将cpp源文件编译为exe可执行文件,当时其实完全不理解,可能将这个过程背下来,因为那时候还不知道什么是汇编语言,什么是字节码,什么是编译器。今天就来简单回味一下。
由流程图可知,整个过程包括预处理,编译,汇编,链接步骤。以下基于GCC编译链接来阐述。
预处理
预处理又叫做预编译,对其中的伪指令和特殊符号进行处理。很多人会写很多个宏定义开关,这个时候就用到了。预编译过程会替换掉所有的宏定义。这一步是最先开始操作。其实伪指令不单单是宏定义,还包括了条件编译指令,头文件包含指令,特殊符号。如果面试官问这个深水区,我想很多人是答不上来的,但是话说也只要知道预处理是针对宏定义指令就可以啦。
预处理过程就是将.c 文件转化成 .i文件,使用的gcc命令是:gcc –E对应于预处理命令cpp
编译
编译是将高级语言翻译为低级语言的过程。这里的低级语言尤其指汇编语言,大都数高级语言到后面都要翻译为汇编语言,所以汇编语言是最接近底层的语言。殊途同归,如果你要破解可执行文件,那么你必须要熟悉汇编语言。其实就是解析语法规则,编码和翻译的过程,然后进行优化处理。有时候你编译的版本有debug版本,有release版本,release版本会做很多的优化工作。
编译compile是逐个cpp文件进行的,没有区分顺序,谁先谁后都一样,你只要声明了一个函数为extern,就可以调用它。编译器不检查是否真得存在这个符号。
编译就是将.c/.h文件转换成.s文件,使用的gcc命令是:gcc –S,对应于编译命令 cc –S
汇编
汇编过程就是将汇编代码翻译成目标机器指令的过程。这个时候生成的文件就是.obj文件。当然不同环境平台也是不一样的。
汇编就是将将.s 文件转化成 .o文件,使用的gcc 命令是:gcc –c,对应于汇编命令是 as
链接
由汇编程序生成的目标文件并不能立即被执行,还需要有符号表,依赖库等。你可能会生成很多个目标文件,而链接的目的就是会整合这些目标文件,最终打包形成一个可执行文件exe。
将各个obj文件综合在一起,生成可执行程序
A.obj,B.obj,……….->Hello.exe。
链接阶段会检查所有的符号名是否重复,检查所有的外部符号是否有定义。有没有发现很多人编译项目工程,到后面会发现链接报错,这些是最尴尬的。大都数报错是符号重复,或者链接库找不到缺失等。
链接就是将将.o文件转化成可执行程序,使用的gcc 命令是: gcc,对应于链接命令是 ld
总结起来编译过程就上面的四个过程:预编译处理(.c) --> 编译、优化程序(.s、.asm)--> 汇编程序(.obj、.o、.a、.ko) --> 链接程序(.exe、.elf、.axf等)。
语言编译的整个过程还是比较复杂的。如果有志于从事安全行业这块,可能就要深入底层的去了解每个环节,特别是汇编环节,能够抽丝剥茧,耐心仔细的梳理各个环节,进行病毒样本分析。黑客一般也是基于底层漏洞进行攻击,因为应用层上面的能做的不多,大都数直接在底层给你搞破坏掉,你就无所遁形。
编程大师
编程学习
28篇原创内容
公众号