前面,我们已经大致了解了ELF文件的轮廓,接下来就看看ELF文件的结构格式。下图,描述的是ELF文件的基本结构。随着我们讨论的展开,ELF文件结构会在这个结构上变得复杂起来。
先来看看文件头(ELF Header)我们用readelf -h命令来查看文件头。因为ELF文件在各种平台下都通用,所以ELF文件有32位和64位版本,它的文件头结构也有这两种版本,分别叫做“Elf32_Ehdr”和“Elf64_Ehdr”,但它们的内容是一样。
我们这里以32位版本的文件头结构作为例子,下图是ELF文件头中各个成员的含义与readelf输出结果的对照表。
ELF魔数 从前面readelf的输出看到,最前面的“Magic”的16个字节刚好对应“Elf32_Ehdr”的e_ident这个成员。这16个字节用来标识这个ELF字长(32位/64位),字节序,ELF文件版本。
文件类型 e-type成员表示ELF文件类型,即前面提到过的三种文件类型。相关常量以“ET_”开头。
机器类型 不同平台下的ELF文件都遵循同一套ELF标准。e_machine成员就表示ELF文件的平台属性,比如3表示该ELF文件只能在Intel x86机器下使用,这也是最常见的情况,相关常量以“EM_”开头。
接下来看下段表(Section Header Table)它保存了文件中所有的段的基本属性的结构,是除了文件头以外最重要的结构。我们可以使用readelf工具来查看ELF文件的所有的段。
段表的结构比较简单,它是一个以“Elf32_Shdr”结构体为元素的数组。数组元素的-ppp个数等于段的个数。“Elf32_Shdr”又被称为段描述符。
其中各个成员的含义如下
段的类型(sh_type) 段的名字只是在链接和编译的过程中有意义,但并不能真正地表示段类型。段的类型相关常量以SHT_开头
段的标志位(sh_flag) 段的标志位表示该段在进程虚拟地址空间中的属性,比如是否可写,是否可执行等,相关常量以SHF_开头。
段的连接信息(sh_link sh_info)如果段的类型是与链接相关的,那么sh_link和sh_info这两个成员所包含的意义如下
重定位表 SimpleSection.o中有一个叫做“rel.text”的段,它的类型为“SHT_REL”,它就是一个重定位表。重定位的信息都记录在ELF文件的重定位表里。
字符串表 ELF文件中用到了很多字符串,它们被放在字符串表中以便于被引用。一般字符串表在ELF文件中也以段的形式保存,常见的有字符串表(String Table)和段表字符串表(Section Header String Table)段名分别为“.strtab” “.shstrtab” 。字符串表用来保存普通的字符串;段表字符串表用来保存段表中用到的字符串。
只有分析ELF文件头,才可以得到段表和段表字符串表的位置,从而解析整个ELF文件。如下