进程的执行(exec)
-
execve
ececve系统调用可以将新程序加载到调用进程的内存空间,在这一过程中,将丢弃现有的进程的文本段,同时,进程的堆栈段,数据都会被新进程的相应部件所替换
在执行完各种初始化代码之后(比如C++的构造函数),新的程序会从main处开始执行
通常的使用方法是使用fork创建子进程,然后使用execve()执行新进程
#include<unistd.h> int execve(const char*pathname, char *const argv[], char *const envp[]) //永远都是返回失败
-
参数解析
pathname:准备载入当前进程空间的新程序的路径名,相对或者绝对都可以
argv:传递给新进程的命令行参数
envp:新程序的环境列表,一般直接赋为environ
-
进程id
execve()调用之后,进程的ID依旧保持不变
-
用户
execve()调用后,会以进程的有效用户ID(effective-id)去覆盖保存用户ID(saved-id)
-
-
exec的各种xd
#include<unistd.h> int execle(const char *pathname, const char *arg, ..., (char *)NULL, char *const envp[]); int execlp(const char *filename, const char *arg, ..., (char *) NULL); int execvp(const char* pathname, char *const argv[]); int execl(const char*pathname, const char *arg, ..., (char *)NULL); //永远都是返回失败
上面的...代表的是可变参数列表,即一个或多个参数,可以使用stdarg系列API进行解读
这些系统调用可以分为3类
-
e类
execve,execle等,他们允许用户通过使用envp参数显式指定环境变量
-
p类
execlp,execvp等,他们只需要提供运行的程序名即可,系统会在环境变量PATH中来找
如果pathname中包含'\',那么系统还是会将其视为路径名而不是文件名
-
l类
execlp,execl等,可以使用可变参数列表来指定参数
-
-
fexecve
fexecve可以执行由文件描述符指定的程序,而不是通过路径名
#include<unistd.h> int fexecve(int fd, char *const argv[], char *const envp[]) //永远返回失败
解释器脚本
上述系统调用其实不仅能够指定可执行文件,还能够指定脚本文件
拿shell举例:
在脚本文件的开头,往往会有着这么一行
#! /bin/bash [附加参数]
这一行用来指定脚本文件的解释器,shell脚本当然就是指定bash了
-
执行过程
当使用exec()(指一系列系统调用)来运行脚本文件时,如果execve()检测到传入的文件以"#!"开头,那么他就会按照如下的参数列表来执行解释器程序
解释器路径 [附加参数] 脚本文件路径 脚本文件参数
其中脚本文件路径和脚本文件参数都是在函数的参数列表中给出的,前面的解释器路径,附加参数都是从脚本文件的首行得到的
由上可以看出,附加参数是与解释器路径搭配使用的,比如指定/bin/bash为解释器,那么就可以使用-c,-i等参数
注:execlp和execvp有些特殊,如果脚本文件首行没有指定解释器,那么他们会通过环境变量找到指定脚本文件后,会默认使用shell来解释
文件描述符与exec
默认情况下,有exec的调用程序所打开的所有文件描述符在exec的执行过程中会保持打开状态,且在新程序中仍然有效,这一特性确保了新执行的进程无需再次打开文件,十分有用
执行时关闭标志(FD_CLOEXEC)
从安全编程的角度出发,应该在加载新程序之前确保关闭那些不必要的文件描述符,打开文件时指定FD_CLOEXEC标志就可以做到这一点
如果设置了该标志,那么在执行exec系统调用时,会自动的关闭该文件,如果调用exec失败,那么文件描述符仍会保持打开状态
信号与exec
-
信号处置
调用exec时会丢弃进程的文本段,那么自然就会丢弃程序的信号处理函数,如果在调用之前对某一个信号的设置为SIG_IGN或者SIG_DFL,那么在执行exec调用后,这些信号的处置将不会改变,否则,信号处置统统都会被置为SIG_DFL
-
掩码及等待队列
在执行exec之后,进程的信号掩码以及pending信号的设置均得以保存