在拜读了刘欢所写的编译和链接那点事后,对编译和链接有了深一步的理解,所谓编译链接即是将无法直接运行的高级语言等转化为计算机可以直接识别的机器语言必不可少的步骤,根据流程画与理解出了gcc编译器的四个过程以及所做工作:
gcc分为四个步骤:预处理(cpp)、编译(cc1)、汇编(as)、链接(ld)。
- 预处理:头文件展开,宏定义展开,注释替换等,这里的展开是将宏定义所有的展开。
extern char *ctermid (char *__s) __attribute__ ((__nothrow__ , __leaf__));
# 840 "/usr/include/stdio.h" 3 4
extern void flockfile (FILE *__stream) __attribute__ ((__nothrow__ , __leaf__));
extern int ftrylockfile (FILE *__stream) __attribute__ ((__nothrow__ , __leaf__)) ;
extern void funlockfile (FILE *__stream) __attribute__ ((__nothrow__ , __leaf__));
# 868 "/usr/include/stdio.h" 3 4
# 2 "Helloworld.c" 2
# 3 "Helloworld.c"
void main(void)
{
printf("helloworld!\n");
}
宏定义为#include<stdio.h>的Helloworld.c预处理(部分)
# 1 "Helloworld.c"
# 1 "<built-in>"
# 1 "<command-line>"
# 31 "<command-line>"
# 1 "/usr/include/stdc-predef.h" 1 3 4
# 32 "<command-line>" 2
# 1 "Helloworld.c"
void main(void)
{
int printf(const char *format,...);
printf("helloworld!\n");
}
只写入printf函数的Helloworld.c预处理(全部)
以上对比可看到,尽管不需要使用除printf之外其他函数的定义,却还是依旧展开了全部,同时只对printf定义也成功通过了编译,在平时我们在用gcc编译时是否是第一步出问题时,可以考虑使用gcc -E来检查。
预处理后所生成的文件后缀为.i,即为预处理文件。
- 编译:将预处理文件进行词法分析、语法分析生成汇编代码文件,这是gcc最核心同时也是最复杂的部分。但此处具体较为复杂,同时需要大量汇编知识,因此笔者并未展开详细说,但是我们可以把他理解为降阶,从高级语言降阶为汇编代码。具体操作为gcc -S,生成后缀为.s的文件,打开为汇编代码。
- 汇编:将翻译后的汇编代码翻译为机器码,几乎每一条汇编指令对应一句机器码。把汇编代码生成后缀为.o的目标文件,目标文件就是经过编译但未进行连接的中间文件,Linux下.o就是目标文件,在Linux下我们可以将目标文件和可执行文件看做同一类型,他们都以ELF文件格式存储。(Linux下的ELF文件类型包括.o文件,可执行文件、核心转储文件(core dump)以及so文件(动态链接库))。
- 最后的步骤则是链接,笔者在这里做了非常详细的说明。何为链接?我们已经将我们所熟悉的高级语言转为了机器码,机器码距离我们最终可执行文件已经非常接近了,但机器码在执行的时候需要很重要的一点就是支撑它执行的库,例如我们常见的C标准库等,链接即把机器码和这些库连接起来,如同把你看书碰到不会的字需要去查字典一样,库分为静态库与动态库。
add.c add.o calc.h libcalc.a swap.c swap.o test test.c
hawl29@hawl29-PC:~/Desktop/test$ rm add.o
hawl29@hawl29-PC:~/Desktop/test$ rm swap.o
hawl29@hawl29-PC:~/Desktop/test$ ls
add.c calc.h libcalc.a swap.c test test.c
hawl29@hawl29-PC:~/Desktop/test$ rm libcalc.a
hawl29@hawl29-PC:~/Desktop/test$ ls
add.c calc.h swap.c test test.c
hawl29@hawl29-PC:~/Desktop/test$ rm test
hawl29@hawl29-PC:~/Desktop/test$ ls
add.c calc.h swap.c test.c
hawl29@hawl29-PC:~/Desktop/test$ gcc add.c swap.c -shared -o libcalc.so
hawl29@hawl29-PC:~/Desktop/test$ ls
add.c calc.h libcalc.so swap.c test.c
hawl29@hawl29-PC:~/Desktop/test$ gcc test.c -o test ./libcalc.so
hawl29@hawl29-PC:~/Desktop/test$ ./test
2 1
hawl29@hawl29-PC:~/Desktop/test$ ldd ./test
linux-vdso.so.1 (0x00007ffd84feb000)
./libcalc.so (0x00007f0743b96000)
libc.so.6 => /lib/x86_64-linux-gnu/libc.so.6 (0x00007f07437a5000)
/lib64/ld-linux-x86-64.so.2 (0x00007f0743f9a000)
hawl29@hawl29-PC:~/Desktop/test$
动手感受了静态库和动态库的区别后了解到,
- 静态库即把库中所有文件编译,需要用哪个的时候直接链接与需要的那部分链接,这样避免了资源浪费,但同时也有很大的缺点就是当库更新后所有的库函数必须重新编译,以及每个程序都要和许多相关文件进行链接,这样很浪费空间。由此产生了动态库。
- 动态库如同一个可释放的静态库,当只有在运行时,由动态链接器完成与程序的链接,这样极大程度的解决了存储空间浪费的问题。
- 链接具体分为空间地址分配、符号决议和重定位等,体现为先找出分配存放它的地址空间,接着统计所有函数等编译后留下的符号,相同同的进行强弱对比,接着寻找每一个确定的符号位置,修正每一个符号地址,最终完成确定的链接。