hook系统调用,意思是用自己的版本的函数覆盖掉系统的版本。
1. 如何hook系统调用?
我们调用系统调用,基本都是通过动态链接的方式使用C标准库libc.so.6。因此,hook的原理就是用让自己的符号覆盖掉C标准库中对应的符号。
因此,有如下两种方式:
1.1. 利用静态链接
把自己实现的系统调用的源文件编译到可执行文件中。这样在编译时就把符号重定位,该符号也不会出现在动态链接的重定位表中,也就不会使用共享库libc.so.6的实现。
1.2. 利用共享对象全局符号介入(Global Symbol Interpose)的机制
当一个新的共享对象被装载进来的时候,它的符号表会被合并到全局符号表中。当一个符号需要被加入全局符号表时,如果相同的符号已经存在,则后加入的符号被忽略。这就是全局符号介入的机制。
也就是说,如果多个共享对象有相同的全局符号,那么程序最终会使用先加载进来的符号。所以,我们可以把自己实现的系统调用源文件编译成共享对象,然后确保它先于C标准库加载进来就可以。
那么,共享对象加载的顺序如何指定?
我们使用gcc 时,写在前面的共享对象会先于写在后面的被加载(例如,gcc -ldl -lpthread中,dl先于pthread加载),而gcc背后实际执行的ld命令会把-lc添加到我们指定的共享对象的后面。因此,我们只需要把自己的共享对象链接上就可以了。
或者使用LD_PRELOAD环境变量。在程序执行前,LD_PRELOAD环境变量指定的共享对象会先于任何其他的共享对象被加载进来。使用这种方式,就不必在编译时用-l指定链接我们的共享对象了。
$ LD_PRELOAD=/path/to/libmy_sys_call.so ./my_executable_file
2. 如何在我们的自己的“系统调用”中使用真正的系统调用?
举例:
#include <stdlib.h>
#include <dlfcn.h>
#include <stdio.h>
void *malloc(size_t size) {
void *(*myMalloc)(size_t) = dlsym(RTLD_NEXT, "malloc");
return myMalloc(size);
}
myMalloc就是C标准库的malloc函数的地址。dlsym我们都熟,RTLD_NEXT选项不常见。使用该选项需要先定义宏_GNU_SOURCE。 该选项的含义是:根据共享对象的搜索顺序,从“当前对象”后搜索某个符号,返回该符号的地址。“当前对象”指的是,dlsym(RTLD_NEXT, "syscall");
代码所在的对象。
对于本例来说,如果我们把我们的malloc编译成libmalloc.so,链接时加上-lmalloc,那么在执行我们的malloc时,dlsym就会根据共享对象的搜索顺序,从libmalloc.so(当前对象)后面的共享对象中搜索malloc符号,并返回符号地址。上共享对象的搜索顺序中,libmalloc.so后面有libc.so.6,因此C标准库的实现会返回。
共享对象的搜索顺序和加载的顺序应该一致(简单实验过,可能不严谨)。