exec
曾提及用fork函数创建新的子进程后,子进程往往要调用一种exec函数以执行另一个程序
。当进程调用一种exec函数时,该进程执行的程序完全替换为新程序,而新程序则从其main函数开始执行。因为调用exec
并不创建新进程
,所以前后的进程ID并未改变
。exec只是用磁盘 上的一个新程序
替换了当前进程
的正文段
、数据段
、堆段
和栈段
。
有7种不同的exec函数可供使用,它们常常被统称为exec函数,我们 可以使用这7个函数中的任一个。这些exec函数使得UNIX系统进程控制 原语更加完善。用fork可以创建新进程,用exec可以初始执行新的程 序。exit函数和wait函数处理终止和等待终止。这些是我们需要的基本的 进程控制原语。
#include <unistd.h>
int execl(const char *pathname, const char *arg0, ... /* (char *)0 */ );
int execv(const char *pathname, char *const argv[]);
int execle(const char *pathname, const char *arg0, .../* (char *)0, char *const envp[] */ );
int execve(const char *pathname, char *const argv[], char*const envp[]);
int execlp(const char *filename, const char *arg0, ... /*(char *)0 */ );
int execvp(const char *filename, char *const argv[]);
int fexecve(int fd, char *const argv[], char *const envp[]);
7个函数返回值:若出错,返回−1;若成功,不返回 这些函数之间的第一个区别是前4个函数取路径名作为参数,后两
个函数则取文件名作为参数,最后一个取文件描述符作为参数。当指定 filename作为参数时:
•如果filename中包含/,则就将其视为路径名;
•否则就按PATH环境变量,在它所指定的各目录中搜寻可执行文 件。
PATH 变量包含了一张目录表(称为路径前缀),目录之间用冒号(:)分隔。例如,下列name=value环境字符串指定在4个目录中进行搜 索。
PATH=/bin:/usr/bin:/usr/local/bin:.
最后的路径前缀.表示当前目录。(零长前缀也表示当前目录。在 value的开始处可用:表示,在行中间则要用::表示,在行尾以:表示。)
如果execlp或execvp使用路径前缀中的一个找到了一个可执行文件, 但是该文件不是由连接编辑器产生的机器可执行文件,则就认为该文件 是一个shell脚本,于是试着调用/bin/sh,并以该filename作为shell的输 入。
fexecve函数避免了寻找正确的可执行文件,而是依赖调用进程来完 成这项工作。调用进程可以使用文件描述符验证所需要的文件并且无竞 争地执行该文件。否则,拥有特权的恶意用户就可以在找到文件位置并 且验证之后,但在调用进程执行该文件之前替换可执行文件(或可执行 文件的部分路径)
函数 execl、execlp和execle要求将新程序的每个命令行参数都 说明为一个单独的参数。这种参数表以空指针结尾。对于另外4个函数 (execv、execvp、execve和fexecve),则应先构造一个指向各参数的指 针数组,然后将该数组地址作为这4个函数的参数。
在使用ISO C原型之前,对execl、execle和execlp三个函数表示命令 行参数的一般方法是:
char *arg0, char *arg1, ..., char *argn, (char *)0
这种语法显式地说明了最后一个命令行参数之后跟了一个空指针。 如果用常量0来表示一个空指针,则必须将它强制转换为一个指针;否 则它将被解释为整型参数。如果一个整型数的长度与char *的长度不 同,那么exec函数的实际参数将出错。
最后一个区别与向新程序传递环境表相关。以e结尾的3个函数 (execle、execve和fexecve)可以传递一个指向环境字符串指针数组的指 针。其他4个函数则使用调用进程中的environ变量为新程序复制现有的 环境(回忆7.9节及图7-8中对环境字符串的讨论。其中曾提及如果系统 支持setenv和putenv这样的函数,则可更改当前环境和后面生成的子进程 的环境,但不能影响父进程的环境)。通常,一个进程允许将其环境传 播给其子进程,但有时也有这种情况,进程想要为子进程指定某一个确 定的环境。例如,在初始化一个新登录的shell时,login程序通常创建一 个只定义少数几个变量的特殊环境,而在我们登录时,可以通过shell启 动文件,将其他变量加到环境中。
在使用ISO C原型之前,execle的参数是:
char *pathname, char *arg0, ..., char *argn, (char *)0, char *envp[]
从中可见,最后一个参数是指向环境字符串的各字符指针构成的数 组的指针。而在ISO C原型中,所有命令行参数、空指针和envp指针都 用省略号(...)表示。
这7个exec函数的参数很难记忆。函数名中的字符会给我们一些帮 助。字母p表示该函数取filename作为参数,并且用PATH环境变量寻找 可执行文件。字母l表示该函数取一个参数表,它与字母v互斥。v表示该 函数取一个argv[ ]矢量。最后,字母e表示该函数取envp[ ]数组,而不使 用当前环境。
每个系统对参数表和环境表的总长度都有一个限制。
这种限制是由ARG_MAX给出的。在POSIX.1系统中,此值至 少是4 096字节。当使用shell的文件名扩充功能产生一个文件名列表时, 可能会受到此值的限制。
为了摆脱对参数表长度的限制,我们可以使用xargs(1)命令,将长参 数表断开成几部分。
前面曾提及,在执行exec 后,进程ID没有改变。但新程序从调用进 程继承了的下列属性:
• 进程ID和父进程ID •实际用户ID和实际组ID •附属组ID
•进程组ID
•会话ID
•控制终端
•闹钟尚余留的时间
•当前工作目录
•根目录
•文件模式创建屏蔽字
•文件锁
•进程信号屏蔽
•未处理信号
•资源限制
•nice值
•tms_utime、tms_stime、tms_cutime以及tms_cstime值
注意文件描述符
对打开文件的处理与每个描述符的执行时关闭(close-on-exec)标
志值有关
FD_CLOEXEC标志的说明,进程 中每个打开描述符都有一个执行时关闭标志。若设置了此标志,则在执行exec 时关闭该描述符;否则该描述符仍打开。除非特地用fcntl设置了 该执行时关闭标志,否则系统的默认操作是在exec后仍保持这种描述符 打开。
意,在exec前后实际用户ID和实际组ID保持不变,而有效ID是否 改变则取决于所执行程序文件的设置用户ID位和设置组ID位是否设 置。如果新程序的设置用户ID位已设置,则有效用户ID变成程序文件 所有者的ID;否则有效用户ID不变。对组ID的处理方式与此相同。
在很多UNIX实现中,这7个函数中只有execve是内核的系统调用。 另外6个只是库函数,它们最终都要调用该系统调用。
#include <iostream>
#include <stdio.h>
#include <unistd.h>
#include <sys/wait.h>
int main() {
execlp("echo", "echo","only 1 args", (char*) 0);
return 0;
}