C代码变成可执行文件的过程

C代码是如何变成程序的

C语言是一门典型的编译语言,源代码文件需要编译成目标代码文件才能运行。可以认为程序文件就是编译好的目标代码文件。以GCC的编译过程为例。GCC的翻译过程可以分成四个阶段:预处理器、编译器、汇编器、链接器,执行这四个阶段的程序一起构成了一个编译系统。

GCC编译系统

预处理器

预处理器(cpp)负责对源代码进行文本处理。它根据以字符#开头的命令,修改原始的C代码。如:

  1. include <stdio.h> 从编译器的内置查找路径的根部开始查找stdio.h文件,读取其内容,并把它直接插入到程序文本中。

  2. include ”my_header.h” 与上条的区别就是查找路径是从当前代码文件所在目录开始。

  3. define MACRO_NAME CONTEXT 将原始代码中所有的MACRO_NAME文本都替换成CONTEXT,这种替换可能会引起很多难以理解的错误。

  4. define FUNC_NAME(PARA_LIST) CONTEXT 与上条类似,区别在于会在查找到FUNC_NAME的地方进行参数匹配,并将CONTEXT中出现的参数名称用对应的文本进行替换。

  5. define MACRO_NAME #undef MACRO_NAME 前者用于单纯的宏定义,后者用于取消宏定义。

  6. ifdef #ifndef #else #endif 这几个都是用于条件编译的命令,用于决定被包括的文本是否加入到处理后的文本中。

常用的预处理命令就是这些,处理后就得到了另一个C代码文件,一般用.i作为扩展名。这部分有一个常用的技巧:header guard,用于防止头文件被重复加载。假设一个场景,某个工程中的3个文件:main.c、a.h、b.h,其中每个文件的开头有这样的文本:

//main.c
#include ”a.h”
#include ”b.h”
//a.h
#include ”b.h”
void func_a();
//b.h
void func_b();

上面提到了预处理器在处理#include时是直接的文本插入,处理后的main.i文件的内容是:

//main.i
void func_b();
void func_a();
void func_b();

b.h的内容被载入了两次!这个例子足够简单,出现这种问题不会发生错误,但如果b.h文件很大,重复加载后可能会出现很多问题,还会导致编译时间的延长。这种情况下我们可以使用header guard来防止头文件被重复加载,中间省略的部分即头文件的正式内容:

#ifndef XXX_YYY_ZZZ
#define XXX_YYY_ZZZ
...
#endif

其中XXX_YYY_ZZZ是你自定义的宏名字。如果为每个头文件选择一个不重复的宏名字,这个宏组合保证了每个头文件只会被一个代码文件载入一次,因为第二次载入时XXX_YYY_ZZZ宏已经定义过了,就直接跳到了#endif的后面。

编译阶段

编译器(ccl)将文本文件hello.i翻译成文本文件hello.s,它包含一个汇编语言程序。汇编语言程序中的每条语句都以一种标准的文本格式确切地描述了一条低级机器语言指令。汇编语言为不同高级语言的不同编译器提供了通用的输出语言,例如C编译器和Fortran编译器产生的输出文件用的都是一样的汇编语言。
例如,hello.c为:

#include <stdio.h>
int main(int argc, char *argv[])
{
    printf("hello world\n");   
    return 0;
}

运行gcc –S hello.c可以得到hello.s文件,其内容为:

.file   "hello.c"
.def    ___main;    .scl    2;  .type   32; .endef
.section .rdata,"dr"
LC0:
.ascii "hello world\0"
.text
.globl  _main
.def    _main;  .scl    2;  .type   32; .endef
_main:
LFB6:
.cfi_startproc
pushl   %ebp
.cfi_def_cfa_offset 8

所有以字符.开头的行都是指导汇编器和链接器的命令,其它行则是被翻译成汇编语言的代码。

汇编阶段

接下来,汇编器(as)将hello.s翻译成机器语言指令,把这些指令打包成一种叫做可重定位目标程序的格式,并将结果保存在目标文件hello.o中。hello.o文件是一个二进制文件,它的字节编码是机器语言指令而不是字符,如果我们在文本编辑器中打开hello.o文件,看到的将是一堆乱码。运行gcc –c hello.c可以得到hello.o文件,它是二进制格式,无法直接查看,可以用反汇编器来查看它的编码:objdump –d code.o以一种典型的可重定位目标格式ELF为例。ELF文件的头部数据包含了:

  1. 生成该文件的系统的字的大小和字节顺序。
  2. 帮助链接器语法分析和解释目标文件信息的数据。ELF文件中包含的数据可分成几个节,每个节的位置和大小是由节头部表描述的:
  3. text 机器代码
  4. rodata 只读数据,比如双引号括起的字符串等。
  5. data 已初始化的全局变量。
  6. bss 未初始化的全局变量。在ELF文件中它只是占位符,在目标文件中不占据实际的空间。
  7. symtab 一个符号表,存放在程序中定义和引用的函数和全局变量的信息。
  8. rel.text 一个.text节中位置的列表,当链接器进行链接时,需要修改这些位置。
  9. rel.data 被引用或定义的全局变量的重定位信息,依赖于其它模块信息的已初始化的全局变量,其值在链接时需要被修改。
  10. debug 调试符号表。
  11. line 机器代码与源文件行号的对应关系,只有在-g选项时才会产生。
  12. .strtab 一个字符串表,包括.symtab和.debug中的符号表,以及每个节的名字。
典型的ELF可重定位目标文件

链接阶段

链接器(ld)负责将多个可重定位目标文件(.o文件)合并为一个可执行文件,如hello程序文件就是由hello.o和printf.o文件合并得来的。合并过程中链接器负责解析符号表,并修改不同编译模块间的引用信息,如hello.o的main函数调用printf函数时,机器代码的跳转位置直到链接阶段才会确定,链接器会将跳转位置修改为printf函数的入口位置。链接器解析本地符号的引用是非常简单的。编译器只允许每个模块中每个本地符号只有一个定义。不过,对全局符号的解析就很复杂。如果链接器在所有模块中都找不到某个符号时,它就输出”undefined reference”错误信息并终止。如果所有符号的解析都顺利完成,链接器最后会输出所有符号的引用位置都确定了的可执行文件。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,417评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,921评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,850评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,945评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,069评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,188评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,239评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,994评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,409评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,735评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,898评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,578评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,205评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,916评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,156评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,722评论 2 363
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,781评论 2 351

推荐阅读更多精彩内容