- 在Perl中调用其他程序的方式有很多,最简单的就是
system
函数,system
函数接受一个或多个参数,其中第一个参数就是要执行的程序名,随后Perl启动一个子进程,执行程序直到返回结果,子进程会继承Perl的标准输入、输出和错误流。
system "date";
system 'ls -l $HOME';
单引号和双引号的区别在于:单引号不会应用变量内插,和其他特殊规则
在Unix系统上,Perl对于简单的命令,通常不经过shell,而是直接在$PATH
的路径里找到程序后直接执行,对于system "date"
来说,date
就是Perl的子进程,但是对于复杂的命令(比如包含分号、数线和美元符号等shell元字符),system
先调用shell,再由shell调用具体的程序。对于system 'ls -l $HOME'
,shell是Perl的子进程,ls是Perl的孙进程
虽然system
函数总是阻塞等待子进程返回,但可以利用shell的&
启动后台进程,这样shell会立刻返回,Perl将继续执行
如果向system
传入多个参数,将不会使用shell,第一个参数指定要执行的程序,其余的参数将传递给这个程序
system
的返回值就是程序的结束状态,在Unix系统中,0
表示正常结束,非零表示异常,这和Perl的规则刚好相反。要判断结果是否正常要么使用unless
unless(system date){
print "Success!";
}
或者在system
前取反
! system "rm -rf test_file.txt" or die "Failed";
注意rm执行失败并不会设置$!
变量的内容,因为system
调用的子程序执行错误并不会被Perl捕获
2 exec
函数也可以用来执行子程序,和system
函数不同之处在于:system
函数是启动一个子进程去执行子程序,然后自己睡眠不再占用CPU时间,当子进程执行完成之后再唤醒原来的Perl进程继续执行之后的程序。但是exec
函数使用了系统调用exec(2)
直接在当前进程跳转执行子程序,这样原来的Perl进程便不复存在了。只有一种情况是例外,如果子程序在启动阶段出错,Perl仍将掌控原来的进程,因为这个时候Perl还没有让出进程的控制权,而且会把子程序错误的原因放入$!
变量:
exec 'date';
die "date couldn't run : $!";
实际上除了die
以外,exec
函数之后的任何其他代码都不会执行,如果exec
执行失败,Perl唯一能做的就是执行die
打印错误信息,然后结束当前进程
exec
函数存在的意义在于有时Perl的作用是为子程序设定运行环境,当环境设定完毕,Perl就没有继续存在的必要。
3 环境变量是大多是操作系统都有的概念,Perl中的环境变量都放在一个哈希表中:%ENV
,每一个键值对应一个环境变量。在Unix系统中最常用的是PATH变量,里面存储着查找程序的路径,当没有指定程序存在的具体路径时,Unix就会逐个检查$ENV{PATH}
中的目录,查找是否存在同名的可执行文件。子程序会继承父进程的环境变量,但是修改从父进程传进来的环境变量并不会影响其他进程,也不会影响shell(shell本身也是一个进程):
$ENV{'PATH'} = "/home/test_path:$ENV{'PATH'}";
delete $ENV{'IFS'};
my $make_result = system "make";
4 system
和exec
函数都会把调用程序的输出定向到标准输出,如果想要在Perl里捕获调用程序的输出结果,并作进一步的处理,只能使用反引号``,当我们执行
demo16-1
:
#!/usr/bin/perl
my $now = `date`;
print "The time is now $now"; #date的返回包括了换行符
Perl会执行date
,并将其标准输出以字符串的形式捕获,并放在$now
变量里。Perl总会捕获标准输出里的所有内容,这通常包括了换行符,所以最好用chomp
函数处理一下:
demo16-2
:
#!/usr/bin/perl
chomp (my $no_newline_now = `date`);
print "The time is now $no_newline_now \n";
反引号基本可以视作system
的单参数版本+双引号传参,这意味着1. 需要小心处理反斜线转义与变量内插的问题。2. 无法用多参数避开shell调用。
demo16-3
:
#!/usr/bin/perl
my @functions = qw { int rand sleep length hex eof not exit sqrt umask};
my %about;
foreach (@functions) {
$about{$_} = `perldoc -t -f $_`;
}
foreach (sort keys %about){
print "$_ : $about{$_}\n";
}
反引号需要注意避免滥用:如果捕获的内容没有被变量保存,那就意味着不需要捕获调用程序返回的内容,这种情况下应该使用system
函数
`test_program arg_1 arg_2`; #应避免在这里使用反引号
system 'test_program arg_1 arg_2';
反引号只会捕获标准输出的内容,如果调用程序执行期间发生错误,就会把错误信息输出到标准错误流里,如果想要捕获标准错误信息,可以利用shell的方式把标准错误流合入标准输出:2>&1
,但这有时会导致最后捕获的内容出现混乱。
my $result = `test_program arg_1 arg_2 2>&1`;
另一个问题出在标准输入上,如有必要反引号也会从标准输入里读取内容,但问题是,一般都会有提示用户输入的标准输出,但别忘了标准输出已经被反引号捕获了,这时用户在屏幕上除了闪烁的光标什么都看不到,用户误以为程序在运行,其实程序在等待用户输入内容。解决办法就是把标准输入重定向到/dev/null
,当程序需要读取标准输入时,只会得到EOF
my $result = `test_program arg_1 arg_2 </dev/null`;
反引号在列表上下文中,会把捕获的内容根据换行符进行分割,然后用列表返回。如果捕获的内容没有换行符那就相当于只有一个元素的列表
demo16-4
:
#!/usr/bin/perl
foreach (`who`){
my($user, $tty, $data) = /(\S+)\s+(\S+)\s+(.*)/;
print "$user: $tty at $date\n";
}
这里结合了反引号和s//
在列表上下文中的用法,s//
在列表上下文中不反回布尔值,而是将捕获的变量放入列表中。
5 不论是system
函数、exec
函数还是反引号,都是由Perl同步控制的:Perl启动一个子程序,等待它执行完毕或者直接结束Perl自己的运行。但是Perl也可以异步控制子程序,并且在子程序运行的过程中和它交互(这不同于用&
实现的后台进程,在那种情况下真正的子进程shell依然和Perl是同步的)。这要用到Unix系统的“管道”和Perl的文件句柄,使用open
打开管道,然后在参数里指定程序名和管道标志:
open DATE, "date|" or die "Cannot pipe from date: $!";
open MAIL, "|mail" or die "Cannot pipe to mail: $!";
第一种方式date|
竖线在date之后,Unix将把date
的输出通过管道传给当前的Perl程序,Perl程序则使用DATE
句柄来接受这部分内容,要获取内容就和从文件句柄中读取信息的方法一样:my $now = <DATE>;
第二种方式|mail
竖线在mail之前,Unix系统将把当前Perl程序的输出通过管道传递给mail
程序的标准输入,而当前Perl程序的输出则由文件句柄MAIL
来控制:print MAIL "the message to mail";
无论是哪一种方式,open都会打开一个独立的进程来执行具体的程序,如果程序启动过程失败,则open
也会失败,并把错误信息放入$!
。
就像普通的文件句柄一样,当不再使用调用程序时,需要关闭文件句柄:
close MAIL;
die "non zero exit: $?" if $?;
这会让Perl等待程序的返回结果并放入$?
变量:0表示正常,非0表示异常。需要注意$?
是全局的,所以会把其他程序的结束状态重置,所以最好尽快使用或转存这个变量的值。像mail这样通过管道获取Perl输出的程序还会得到一个EOF
。
相比于同步控制,文件句柄不用等到调用程序执行完再开始对返回结果进行处理,每次收到新的内容都可以在Perl中进行处理,对于一些返回结果比较大,处理时间比较长的调用程序是非常有用。
6 Perl还可以用fork
直接执行系统调用接口
7 Unix信号是发往一个程序的脉冲,操作系统通常会定义一组整型数和对应的信号代表某种事件发生,信号可以由操作系统或者程序发出和接受。在Perl中发信号给别的进程需要先知道对方的pid。发送信号的命令是kill
,这是因为杀掉进程通常就是信号所需要做的全部事情。
kill 2, 4201
kill
命令的第一个参数就是信号类型,这里2就对应着SIGINT
中断信号。第二个参数是对方进程的pid,在Perl里获取这个值稍微有些复杂。
在Perl中接收信号的方式有所不同,需要对一个特殊哈希%SIG
赋值来设定信号处理程序
demo16-5
#!/usr/bin/perl
sub signal_handler{
print "I'm signal handler and I received the interrupt signal.\n";
die "Interrupt executed by signal_handler.";
}
$SIG{"INT"} = "signal_handler";
while (1) {};
程序执行后不会做任何事,直到按下ctrl-C
./demo16-5
^CI'm signal handler and I received the interrupt signal.
Interrupt executed by signal_handler. at ./demo16-5 line 4.
%SIG
的哈希键就是信号名(没有通用前缀SIG),哈希键的内容就是信号处理函数名(没有&
符号)