php多进程实例总结

多进程--fork

场景:日常任务中,有时需要通过php脚本执行一些日志分析,队列处理等任务,当数据量比较大时,可以使用多进程来处理。

准备:php多进程需要pcntl,posix扩展支持,可以通过 php - m 查看,没安装的话需要重新编译php,加上参数--enable-pcntl,posix一般默认会有。

注意:多进程实现只能在cli模式下,在web服务器环境下,会出现无法预期的结果,我测试报错:Call to undefined function: pcntl_fork()``

注意两点:
1.如果是在循环中创建子进程,那么子进程中最后要exit,防止子进程进入循环。
2.子进程中的打开连接不能拷贝,使用的还是主进程的,需要用多例模式。

pcntl_fork:

一次调用两次返回,在父进程中返回子进程pid,在子进程中返回0,出错返回-1。

pcntl_wait ( int &status [, intoptions ] ):

阻塞当前进程,直到任意一个子进程退出或收到一个结束当前进程的信号,注意是结束当前进程的信号,子进程结束发送的SIGCHLD不算。使用$status返回子进程的状态码,并可以指定第二个参数来说明是否以阻塞状态调用

阻塞方式调用的,函数返回值为子进程的pid,如果没有子进程返回值为-1;

非阻塞方式调用,函数还可以在有子进程在运行但没有结束的子进程时返回0。

pcntl_waitpid ( int pid , int &status [, int $options ] )

功能同pcntl_wait,区别为waitpid为等待指定pid的子进程。当pid为-1时pcntl_waitpid与pcntl_wait 一样。在pcntl_wait和pcntl_waitpid两个函数中的$status中存了子进程的状态信息。

检测是否是cli模式

/** 确保这个函数只能运行在SHELL中 */
if (substr(php_sapi_name(), 0, 3) !== 'cli') {
  die("cli mode only");
}

SHELL脚本实现多进程(Qbus的多进程就是这样实现的,只不过用上了nohup 和 & 改为守护进程):

#!/bin/bash 
for((i=1;i<=8;i++))
 do    
    /usr/local/bin/php multiprocessTest.php & 
done

wait

上面的shell程序,列了一个很简单的多进程程序,用一个for循环,实现了8个进程并发来跑multiprocessTest.php这个程序。最后的wait语句,也可以使主进程,再等待所有进程都执行完后再往下执行的需求。

这个程序是没有问题的,很多现有的代码也都这样实现,但是这个程序的并发数是不可控的,即我们无法根据机器的核数去调度每一个进程的开关。

若我们的机器有8核或者更多,上面的程序是没有问题的,所有核都能充分利用,并且互相之间,没有争抢资源的情况出现。

但我们的机器要没有8核的话会是什么情况,同一时间运行的进程数多于核数,那么系统就会出现进程分配调度的问题,争抢资源也跟着相应而来,一个进程不能保证独立连续的执行,所有的进程运行会听从系统的调度,这样就会有更多的不确定因素出现。

一个始终保持固定个数的子进程在跑的例子

<?php

//最大的子进程数量
$maxChildPro = 8;

//当前的子进程数量
$curChildPro = 0;

//当子进程退出时,会触发该函数,当前子进程数-1
function sig_handler($sig)
{
    global $curChildPro;
    switch ($sig) {
        case SIGCHLD:
            echo 'SIGCHLD', PHP_EOL;
            $curChildPro--;
            break;
    }
}

//配合pcntl_signal使用,简单的说,是为了让系统产生时间云,让信号捕捉函数能够捕捉到信号量
declare(ticks = 1);

//注册子进程退出时调用的函数。SIGCHLD:在一个进程终止或者停止时,将SIGCHLD信号发送给其父进程。
pcntl_signal(SIGCHLD, "sig_handler");

while (true) {
    $curChildPro++;
    $pid = pcntl_fork();
    if ($pid) {
//父进程运行代码,达到上限时父进程阻塞等待任一子进程退出后while循环继续
        if ($curChildPro >= $maxChildPro) {
            pcntl_wait($status);
        }
    } else {
//子进程运行代码
        $s = rand(2, 6);
        sleep($s);
        echo "child sleep $s second quit", PHP_EOL;
        exit;
    }
}

一个使用waitpid函数等待全部子进程退出,防止僵尸进程的例子

<?php

$childs = array();

// Fork10个子进程
for ($i = 0; $i < 10; $i++) {
    $pid = pcntl_fork();
    if ($pid == -1)
        die('Could not fork');

    if ($pid) {
        echo "parent \n";
        $childs[] = $pid;
    } else {
// Sleep $i+1 (s). 子进程可以得到$i参数
        sleep($i + 1);

// 子进程需要exit,防止子进程也进入for循环
        exit();
    }
}

while (count($childs) > 0) {
    foreach ($childs as $key => $pid) {
        $res = pcntl_waitpid($pid, $status, WNOHANG);

//-1代表error, 大于0代表子进程已退出,返回的是子进程的pid,非阻塞时0代表没取到退出子进程
        if ($res == -1 || $res > 0)
            unset($childs[$key]);
    }

    sleep(1);
}

一个实际的例子,php实现并发log拷贝

<?php
function _fetchLog()
{
    $password        = $this->_getPassword();
    $online_log_path = NginxConf::getArchiveDir($this->_stat_day);
    $task_log_path   = QFrameConfig::getConfig('LOG_PATH');
    $children        = array();
    $success         = true;
    foreach($this->_server_list as $host => $value)
    {
        $local_dir = $this->_prepareLocalDir($host);
        $task_log  = "$task_log_path/fetch_log.$host";
        $cmd = "sshpass -p $password rsync -av -e 'ssh -o StrictHostKeyChecking=no' $host:$online_log_path/* $local_dir >> $task_log 2>&1";
        $pid = pcntl_fork();
        if(-1 === $pid)
        {
            LogSvc::log('stat_pv_by_citycode_error', 'could not fork');
            exit('could not fork');
        }
        else if(0 === $pid)
        {
            system($cmd, $return_value);//执行一个linux系统命令 带有返回值
            if(0 !== $return_value)
            {
                LogSvc::log('stat_pv_by_citycode_error', "rsync $host error");
            }
            exit($return_value);
        }
        else
        {
            $children[$pid] = 1;
        }
    }
    while(!empty($children))
    {
        $pid = pcntl_waitpid(-1, $status, WNOHANG);
        if(0 === $pid)
        {
            sleep(1);
        }
        else
        {
            if(0 !== pcntl_wexitstatus($status))
            {
                $success = false;
            }
            unset($children[$pid]);
        }
    }
    return $success;
} 

多进程--信号

同类信号只能存储一个,多余的自动丢弃

可以发送小于0的值代表发给全部子进程,包括自己,其实是一个组的进程。

PCNTL使用ticks来作为信号处理机制(signal handle callback mechanism),可以最小程度地降低处理异步事件时的负载。何谓ticks?Tick 是一个在代码段中解释器每执行 N 条低级语句就会发生的事件,这个代码段需要通过declare来指定。

pcntl_signal ( int $signo , callback $handler [, bool $restart_syscalls ] ) 
//为某个SIG注册一个处理函数

posix_kill(posix_getpid(), SIGHUP);为自己生成SIGHUP信号``

declare(ticks = 1); //php < 5.3

pcntl_signal_dispatch ( void )

调用每个等待信号通过pcntl_signal()安装的处理器。说明一下:pcntl_signal()函数仅仅是注册信号和它的处理方法,真正接收到信号并调用其处理方法的是pcntl_signal_dispatch()函数必须在主事件循环里调用,为了检测是否有新的信号等待dispatching。

pcntl_signal_dispatch()

这个函数是PHP 5.3以上才支持的,如果你的PHP版本大于5.3,建议使用这个方法调用信号处理器。5.3以下的版本需要在注册信号之前加一句:declare(ticks = 1);表示每执行一条低级指令,就检查一次信号,如果检测到注册的信号,就调用其信号处理器。

pcntl_alarm ( int $seconds )

设置一个$seconds秒后发送SIGALRM信号的计数器

5.发送信号:

posix_kill(): 向进程发送信号。

SIGINT : 通过键盘CTRL+C.

SIGTERM : 有时候进程失去响应了还会执行kill [PID]命令,未加任何其他参数的话,程序会接收到一个SIGTERM信号。

程序收到上面两个信号的时候,默认都会结束执行,可以通过注册信号改变默认行为。

一个注册信号处理器的例子,得到结论:

sleep函数会被信号唤醒,不再休眠,返回唤醒时剩余的秒数

对于说法同类信号只能存储一个,多余的自动丢弃,测试发现多次CTRL+C后,进程会先唤醒sleep,再唤醒usleep,当执行到pcntl_signal_dispatch时,会一次输出多个“SIGINT”,不知道存储一个是不是只的是什么地方。

<?php

// 定义一个处理器,接收到SIGINT信号后只输出一行信息
function signalHandler($signal)
{
    if ($signal == SIGINT) {
        echo 'SIGINT', PHP_EOL;
    }
}

// 信号注册:当接收到SIGINT信号时,调用signalHandler()函数
pcntl_signal(SIGINT, 'signalHandler');

/**
 * PHP < 5.3 使用
 * 配合pcntl_signal使用,表示每执行一条低级指令,就检查一次信号,如果检测到注册的信号,就调用其信号处理器。
 */
if (!function_exists("pcntl_signal_dispatch")) {
    declare(ticks=1);
}

while (true) {
    $s = sleep(10);
    echo $s, PHP_EOL; //信号会唤醒sleep,返回剩余的秒数。

// do something
    for ($i = 0; $i < 5; $i++) {
        echo $i . PHP_EOL;
        usleep(100000);
    }

    /**
     * PHP >= 5.3
     * 调用已安装的信号处理器
     * 必须在循环里调用,为了检测是否有新的信号等待dispatching。
     */
    if (!function_exists("pcntl_signal_dispatch")) {
        pcntl_signal_dispatch();
    }

}

一个隔5s发一个信号的例子,通过pcntl_alarm实现

<?php

declare(ticks = 1);

function signal_handler($signal) {
    print "Caught SIGALRM\n";
    pcntl_alarm(5);
}

pcntl_signal(SIGALRM, "signal_handler", true);
pcntl_alarm(5);

for(;;) {
}

一个通过发送信号杀死进程的例子,信号可以发给自己也可以发给其他进程。

<?php

/**
 * 父进程通过pcntl_wait等待子进程退出
 * 子进程通过信号kill自己,也可以在父进程中发送kil信号结束子进程
 */

//生成子进程
$pid = pcntl_fork();
if($pid == -1){
    die('could not fork');
}else{
    if($pid){
        $status = 0;
//阻塞父进程,直到子进程结束,不适合需要长时间运行的脚本.
        //可使用pcntl_wait($status, WNOHANG)实现非阻塞式
        pcntl_wait($status);
        exit;
    }else{
//结束当前子进程,以防止生成僵尸进程
        if(function_exists("posix_kill")){
            posix_kill(getmypid(), SIGTERM);
        }else{
            system('kill -9'. getmypid());
        }
        exit;
    }
}

多进程--僵尸进程

当子进程比父进程先退出,但是父进程还在运行中并且可能很长一段时间不会退出,子进程就变成了僵尸进程。然后内核会找到这个僵尸进程的PPID,给这个PPID发送一个SIGCHLD信号。如果父进程中没有通过pcntl_wait或者pcntl_waitpid函数处理,并且没有通过posix_kill发送退出信号给子进程,那么这个子进程就彻底僵尸了。

ps aux查看到时Z(zombie)状态。

一般需要在父进程结束前回收子进程先,pcntl_wait()函数会将父进程挂起,直到一个子进程退出。

如果父进程先挂了,子进程会被1号进程接管,当子进程结束时1号进程会自动回收。所以关闭僵尸进程的另一种方法就是关闭他们的父进程。

子进程如何得知父进程退出:

1. 当父进程退出时,会有一个INIT进程来领养这个子进程。这个INIT进程的进程号为1,所以子进程可以通过使用getppid()来取得当前父进程的pid。如果返回的是1,表明父进程已经变为INIT进程,则原进程已经推出。
2. 使用kill函数,php中是posix_kill,向原有的父进程发送空信号(kill(pid, 0))。使用这个方法对某个进程的存在性进行检查,而不会真的发送信号。所以,如果这个函数返回-1表示父进程已经退出。

僵尸进程:

在UNIX 系统中,一个进程结束了,但是他的父进程没有等待(调用wait / waitpid)他,那么他将变成一个僵尸进程。

僵尸进程是一个早已死亡的进程,但在进程表 (processs table)中仍占了一个位置(slot)。

僵尸进程不及时回收,会在系统中占用一个进程表项,如果这种僵尸进程过多,最后系统就没有可以用的进程表项,于是也无法再运行其它的程序。

任何进程在退出前(exit退出)都会变为僵尸进程。用于保存进程的状态等信息。为什么呢?

子进程的结束和父进程的运行是一个异步过程,即父进程永远无法预测子进程到底什么时候结束。那么 会不会因为父进程太忙来不及 wait 子进程,或者说不知道子进程什么时候结束,而丢失子进程结束时的状态信息呢?不会。因为UNIX提供了一种机制可以保证,只要父进程想知道子进程结束时的 状态信息,就可以得到。这种机制就是:当子进程走完了自己的生命周期后,它会执行exit()系统调用,内核释放该进程所有的资源,包括打开的文件,占用 的内存等。但是仍然为其保留一定的信息(包括进程号the process ID,退出码exit code,退出状态the terminationstatus of the process,运行时间the amount of CPU time taken by the process等),这些数据会一直保留到系统将它传递给它的父进程为止,直到父进程通过wait / waitpid来取时才释放。

预防僵尸进程

(1) 父进程通过wait和waitpid等函数等待子进程结束,这会导致父进程挂起。它不适合子进程需要长时间运行的情况(会导致超时)。

执行wait()或waitpid()系统调用,则子进程在终止后会立即把它在进程表中的数据返回给父进程,此时系统会立即删除该进入点。在这种情形下就不会产生defunct进程。

(2) 如果父进程很忙,那么可以用signal函数为SIGCHLD安装handler。在子进程结束后,父进程会收到该信号,可以在handler中调用wait回收。

(3) 如果父进程不关心子进程什么时候结束,那么可以用signal(SIGCLD, SIG_IGN)或signal(SIGCHLD, SIG_IGN)通知内核,自己对子进程的结束不感兴趣,那么子进程结束后,内核会回收,并不再给父进程发送信号

(4)fork两次,父进程fork一个子进程,然后继续工作,子进程fork一个孙进程后退出,那么孙进程被init接管,孙进程结束后,init会回收。不过子进程的回收还要自己做。

查看和清零僵尸进程:测试发现通过 ps -ef 和 aux 是不能看到僵尸进程的。

需要通过top命令实时看到当前系统的僵尸进程个数。

用ps命令查看僵尸进程:

 ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]'

命令注解:

-A 参数列出所有进程

-o 自定义输出字段 我们设定显示字段为 stat(状态), ppid(进程父id), pid(进程id),cmd(命令)这四个参数

状态为 z或者Z 的进程为僵尸进程,所以我们使用grep抓取stat状态为zZ进程

这时,可以使用 kill -HUP 5255 杀掉这个进程。如果再次查看僵尸进程还存在,可以kill -HUP 5253(父进程)。

如果有多个僵尸进程,可以通过处理。

ps -A -ostat,ppid,pid,cmd | grep -e '^[Zz]' | awk 'print{$2}' |xargs kill -9
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,132评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,802评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,566评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,858评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,867评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,695评论 1 282
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,064评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,705评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,915评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,677评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,796评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,432评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,041评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,992评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,223评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,185评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,535评论 2 343

推荐阅读更多精彩内容