升级pika遇到的问题解决及反思

前言

一次原以来很简单的pika升级(关掉slave,替换可执行文件,重启,然后主从切换,完成升级),两三个小时搞定,前后竟然折腾了一周,有必要总结下。

pika升级遇到问题

  1. pika运行环境带来的问题
    线上环境pika使用的操作系统是centos6,gcc版本是4.4.7,而pika编译安装的环境要求gcc不能低于4.8,与运维同事沟通后,得知在centos6上升级gcc到新版本很麻烦,而且会有坑,建议直接在centos7上部署完整的环境。就选定用centos7部署新的版本pika,加入slave,切换master方式升级。
    这个过程又遇到两个问题:
    (1). 以为pika的安装运行环境的依赖库只需要在编译环境安装即可,后发现运行环境也必须按照相应的要求安装。
    (2). 在一台机器编译并能够运行成功,但拷贝到其他机器上就报illegal instruction,定位为指令集不兼容的问题,使用的云环境不想再具体定位为啥指令集不兼容(同样的操作系统),就将代码拉到运行环境编译运行,然后拷贝到其他机器解决。
  2. 旧版本pika 卡死
    开始升级pika时,遇到旧版本pika卡死的请求,后来和360的pika开发小伙伴沟通后,被告知这是pika 2.1版本的一个bug,在新版本pika 2.2.3已经fix,也正是这个bug,促使了我们在后面遇到问题时,也要尝试解决问题进行升级。一个数据库运行着卡死,这雷真心受不了。。还好卡死不是毕现的,遇到了一次
  3. pika同步不成功
    在进行pika主从数据同步时,运维同事发现一直在进行全量数据同步,后来分析了下是由于binlog保留的太少了,导致在pika写数据量多时,全量同步完无法进行增量同步,重复全量同步,后来看了下相关实现及与pika开发小伙伴交流,通过在线 config set expire-logs-nums 500解决,这个设置这么大耗费硬盘还是比较多的,应该设置200左右就可以了~
  4. pika的主从互换后无法建立主从关系
    这个问题分析了下是由于断开旧的主从关系时,旧的master上一些数据(binlog)还没有同步到旧slave上,而旧slave切换为新master后,旧的master作为新master的slave进行同步,会因为binlog的offset问题无法正常建立主从关系,INFO查看同步状态码为5,即错误状态。另一个导致不能进行主从同步的问题,有时在进行主从同步时,报某个binlog不存在,解决办法就是把那个binlog touch出来~~。在交流群里大家讨论了下,目前pika在Gracefully shutdown时,还是不够足够的graceful,应该是先将停写,然后将数据同步完,再shutdown比较合适。这个主从同步问题目前的解决办法是可以来一次全同步。。
  5. 新版本pika做为master挂掉
    进行新旧版本切换时发现,把新版本的pika切为master,过几分钟后,新版本的master会挂掉,相关log看不出问题所在,后与360 pika的小伙伴沟通后,他们判断为那个pika进程的文件句柄被写满了,导致挂掉,后来查看了下pika进程的文件描述符限制远小于系统设定的。后定位到原因是由于启动pika的monit进程的最大文件描述符的限制是4095,导致pika最大文件描述符的限制是4095,导致too many open files而挂掉pika。

总结

pika在线上稳定运行快10个月了,这个过程没有出现明显的异常,还是很赞的。根据pika实现(将数据存在磁盘中,还有主从)及这么长时间的稳定运行,觉得这次升级还是比较容易,风险不大的,但还是发现了上面的这些问题。这次是在一个资深运维协助下进行的升级,不然估计还会有不少其他的问题。。
这次升级持续这么长时间,我在想这中间是有哪些是可以在升级前做的更多的吗,第一个问题中的编译运行环境可以提前测试确定出来,第三个问题在单机环境测试出来,不知道电脑能不能扛的住。。第四个问题如果测试覆盖够也可以发现这个问题(虽然这个问题发现了,也没太好的解决,只是避免了不必要的问题查看定位),其他的依然比较难发现出来。
对一个长时间没有进行升级的组件进行升级需要慎重,应对方案要考虑全,尤其是基础组件,应对失败,回退方案及可行步骤一定要提前准备好,侥幸要不得。
最终升级成功,祝大家玩的愉快~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,335评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,895评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,766评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,918评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,042评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,169评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,219评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,976评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,393评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,711评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,876评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,562评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,193评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,903评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,142评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,699评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,764评论 2 351

推荐阅读更多精彩内容

  • 环境 操作系统:CentOS-6.6-x86_64-bin-DVD1.iso MySQL版本:mysql-5.6....
    思梦PHP阅读 2,040评论 0 12
  • 梁思成问:“有一句话,我只问这一次,以后都不会再问,为什么是我?” 林徽因答:“答案很长,我得用一生去回答你,准备...
    你好啊艾伦郭阅读 281评论 0 1
  • 微风过,树叶动。 每个时刻总有那么一首十分应景的歌曲听到你心坎里,那《相守》就是今晚的最佳选择。 晚饭过后,人群散...
    思无所诗阅读 335评论 0 6
  • 她一个人在商场闲逛,明天是西方的情人节,商家们自然不肯放过大好的赚钱时机,所有的柜台均布置得温馨浪漫,空气里飘着香...
    迅图阅读 181评论 2 0
  • 开心一笑 造句:1.难过。学生:我家门前有条水沟很难过。老师批语:我更难过。2.天真。学生:夏天真热。老师:我一头...
    架构师启示录阅读 1,055评论 2 4