准备工作
准备一个c文件:ELF文件结构:
ELF header
elf的头,存放了一些描述性的信息e_hsize:elf header的大小,这里是0x40, 64byte
e_shoff:节头表(sht)相对于0x0的偏移,这里是0x2b0,也就是说第688个字节开始就是节头表
e_shentzie:sht一个表项的大小,这里是0x40,64byte
e_shnum:sht有多少个表项,这里是0xb,11个
用readelf -h命令可以清晰的看到elf header的信息:
Section Header Table
节头表,每一个表项存放了对应节的描述信息sh_name:节的名字,这里第一个是.text,第二个是.data;0x21是指向sh string table中某个字符串的索引;string table就是字符串的集合:xxxx'\0'xxx'\0'...,sh string table就是section header的string table
这里节的名字就从sh string table中索引为0x21的位置开始读,读到'\0'为止
sh_type,sh_flags:这两个东西表明了这个节的一些性质或者说属性
sh_offset:当前节0x0的偏移,这里是0x50,可以看到第一个节的偏移是0x40,紧接着elf header(无视第0个)
sh_size: 节的大小,这里是0x10
sh_entsize:如果当前节是一个表,那么这个字段表示一个表项的大小,这里是0
strtab
字符串常量池
一张结构图:
symtab
symbol table,符号表,存放 程序中定义和引用的函数和全局变量的信息
我们通过readelf -S可以看到sht的所有表项,发现.symtab的起始位置为0x140,通过readelf -s可以看到符号表的所有表项如下:
发现我们自己定义的数据是从第八项开始,由此可以计算出起始地址0x140 + 0x18 * 8 = 0x200,那么[0x200, 0x200 + 0x18 * 4 - 1 = 0x25f]就是我们关心的数据:
st_name:符号的名字,同样是strtab的索引,由readelf -S可知strtab的起始地址为0x260,偏移0x08的字符串确实就是data1
st_shndx:当前符号所在节的索引,这里是0x2,也就是.data节,偏移为0x50 (前一个是.text,偏移为0x40)
st_value:在st_shndx指向节的offset (在.common下含义不同)
st_size:符号代表值的大小,这里是8byte;由此也可以看出,在编程语言中的类型,实际上就是一个长度限制
可以发现,data1的值为0x77777777ffffffff,与.c文件中匹配;由此只要给出任意一个symbol,都能找到他在elf中的位置
st_other:保留,都是0x0
st_info:这个字段占一个byte,高4位表示bind,第四位表示type;这两个东西结合起来描述了当前符号的一些性质(例如是变量还是函数,是否被static修饰等等。。。)
std_info定义:
bind和type的取值:
从图中可以看出data1的st_info是0x11,说明是一个全局变量
下面看一些不同的情况:
a1:全局变量且初始化为零,对应object,global,.bss节
a2:全局变量初始化不为零,对应object,global,.data节
a3:static变量初始化不为零,对应object,local,.data节
a4:extern的全局全局变量,但是又没有找到相关的定义,所以type是NOTYPE(0),自然也是找不到所属在哪一节的,所以st_shndx是UND,这是一个宏,定义如下
/* Symbol table indices are found in the hash buckets and chain table
of a symbol hash table section. This special index value indicates
the end of a chain, meaning no further symbols are found in that bucket. */
#define STN_UNDEF 0 /* End of a chain. */
b1:b1是一个未初始化的全局变量,对应object,global,?
在和别的文件一起链接时,如果能在别的文件中找到b1的定义为0,则?为.bss,如果不为零,则为.data,如果找不到则为.bss;由此发现?的内容无法确定,所以st_shndx写了COM(5),此时st_value也无法表示偏移了,而是表示当前符号代表的数据是按多少对齐