多进程编程mysql超时定位

背景介绍

年前对下单中的异步出单队列进行了重构,用主进程fork子进程处理消息队列。因为可以通过控制子进程的数量,提高该消息队列的处理效率。由于一开始,都只是先上消息量不大的队列,所以都只fork了一个子进程。在生产上偶发子进程丢失mysql连接,一开始认为是mysql超时了,修改了代码,改为每次拿到新消息都示例化一个新的model去拿数据,并且在代码上加入了异常告警,后面仍出现丢失MySQL连接。后面发现是在父进程一开始就示例化了mysql连接,并且在php的tp3.2框架中,对model做了静态单例。

第一次遇到mysql超时

身为一个弱到爆的开发,我一开始认为是mysql超时了,为了快速把生产问题处理掉,就在每次拿到消息时,实例化model。并以为这样就处理掉了。

第二次遇到

过了几天,子进程丢失mysql连接的事故依然发生。这次我在代码上加入了异常告警,并且开始想着如果把这个问题处理掉。
查看mysql超时设置,发现mysql的超时时间为86400,但是生产的进程每天凌晨都会进行一次重启,显然,并不是mysql连接超时导致的。
为了找出问题,将生产的代码,写了简化版本在测试环境跑了起来。
以下为示例代码:

<?php
namespace UnionGate\Daemon;

use Home\Common\Logger;
Logger::init();
use \Org\Util\MsgQ;
class TestMysqlConnect{
    
    private $conn;


    private $model;

    public function __construct()
    {
        $this->model =  new AModel();
    }

    //跑这个方法运行
    public function run()
    {
        for ($i = 0; $i < 3; $i++) {
            $nPID = \pcntl_fork();//创建子进程
            if ($nPID == 0) {
                $this->work();
                exit(0);
            }
        }

        $n = 0;
        while ($n < $this->procNum) {
            $nStatus = -1;
            $nPID = \pcntl_wait($nStatus);
            if ($nPID > 0) {
                ++$n;
            }
        }
      
        exit;
    }


    //起进程
    protected function work()
    {
        $MsgData = "";
        while (true) {
            usleep(10000);
            \Org\Util\MsgQ::init();
            $ret = MsgQ::BlockSubsribe('testMysqlConnect', $MsgData);
            if ($ret === false) {
                continue;
            }
            $this->doSomething();
        }
    }

    protected function doSomething()
    {

    }

}

use Think\Model;
class AModel extends Model{

    protected $tablePrefix = 't_';
    protected $tableName = 'underwrite_tmp';

    protected $dbName = "underwrite";
    //数据库配置
    protected $connection = "UNDERWRITE_DB_CONFIG";
}

在测试环境跑了大概有12小时候之后,果然问题复现了。
这里通过netstat -anp | grep pid 命令查看进程监听的端口,发现问题发生的时候,mysql的连接已经不见了。

mysql连接关闭的原因

  • mysql 的server端主动关闭,(超过了超时时间)
  • mysql的server端主动关闭,mysql发现tcp的包时序出现了异常(即多个进程用了同一个连接)
  • mysql的client端关闭,资源被回收了(进程退出,变量被unset)

对应的

  • 因为mysql的系统设置 超时时间都是86400,且进程在每天都会被重启一次,所以不是因为超时关闭的。
  • 因为主进程后面只做对子进程的监听,并没有尝试与mysql进行连接,所以应该不是主进程和子进程复用同一个连接导致的
  • 阅读了tp3.2的db实现的底层源码,发现tp在db连接上,做了静态单例,查了php的fork,发现php直接调用了系统的fork函数。
/* {{{ proto int pcntl_fork(void)
   Forks the currently running process following the same behavior as the UNIX fork() system call*/
PHP_FUNCTION(pcntl_fork)
{
    pid_t id;

    id = fork();
    if (id == -1) {
        PCNTL_G(last_error) = errno;
        php_error_docref(NULL, E_WARNING, "Error %d", errno);
    }

    RETURN_LONG((zend_long) id);
}

出现连接超时的原因

因为有构造函数的存在,导致一开始,父进程就有了mysql连接的静态单例,直接用了linux的fork,可以直接认为这时候子进程和主进程的变量都是一致。因而,子进程用了父进程的MySQL连接,而且,因为做了静态单例,所以不管怎么实例化,都是得到同一个mysql连接。

解决方法

主进程一进来,只做fork子进程的工作,别的连接都不处理。让子进程自己去实例化各个资源即可

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,242评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,769评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,484评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,133评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,007评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,080评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,496评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,190评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,464评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,549评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,330评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,205评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,567评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,889评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,160评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,475评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,650评论 2 335

推荐阅读更多精彩内容

  • 1.内存的页面置换算法 (1)最佳置换算法(OPT)(理想置换算法):从主存中移出永远不再需要的页面;如无这样的...
    杰伦哎呦哎呦阅读 3,199评论 1 9
  • 必备的理论基础 1.操作系统作用: 隐藏丑陋复杂的硬件接口,提供良好的抽象接口。 管理调度进程,并将多个进程对硬件...
    drfung阅读 3,505评论 0 5
  • 一. 操作系统概念 操作系统位于底层硬件与应用软件之间的一层.工作方式: 向下管理硬件,向上提供接口.操作系统进行...
    月亮是我踢弯得阅读 5,938评论 3 28
  • 顾名思义,进程即正在执行的一个过程。进程是对正在运行程序的一个抽象。进程的概念起源于操作系统,是操作系统最核心的概...
    SlashBoyMr_wang阅读 1,113评论 0 2
  • 进程 操作系统背景知识 顾名思义,进程即正在执行的一个过程。进程是对正在运行程序的一个抽象。 进程的概念起源于操作...
    go以恒阅读 928评论 0 2