[原创] 实战生产问题:真的别再使用TimerTask了!

最近有版本特性要上线,但是在上线的过程中遇到了“阻碍”,使得上线过程不是很顺利,想必你也曾经遇到过吧!

1、问题背景

说说大概的场景吧。由于系统里面增加了权限的限制,不同用户拥有不同的数据权限。当前的方案是查询用户uid和对应的数据列表存放在本地内存里,并且需要定时捞取对应的关系数据存储在本地缓存LocalCacheMap中,key为uid,value为List。

接着其它接口则根据LocalCacheMap获取对应的数据权限进行相关的判断。

我们准备上线时,发现功能不正常,本来应该是能正常过滤权限数据的时候却没有生效?

但是其它同学在测试环境验证基本没问题的!所以就有很大的疑问了。

我都不相信这功能真的在测试环境上OK?对测试结果表示怀疑,所以我跟组内同学在测试环境验证一波,确实是没问题的。那么继续查看检验代码逻辑,查看是否有哪里不严谨,可能存在隐藏的bug。

在看代码的过程中也发现了日志打的太少了,重点的地方都不打下,起码还能知道从哪里跟踪,(对于代码注释等规范,可见原创《互联网Code Review最佳实践分享》),所以对于这点暂且不说,我也不想说重新补打日志,然后重新打包,发版排查。

为了一探究竟,此时必然还是需要使用强大的工具Arthas,之前就已经解决过我的生产问题。

可见于原创:《实战使用Arthas排查生产问题:实例方法接口调用》,所以继续使用阿尔萨斯Arthas来排查定位。

2、排查解决问题

1)排查一

此时借助Arthas,尝试调用获取缓存数据:

调用实例方法,获取到的结果为null,说明缓存中没有我要的数据,这就很奇怪了。然后我去验证拉去权限数据的接口,手动去调http接口,此时在服务器上使用curl手动调用接口,但是接口返回的443,所以我怀疑是不是调用的接口问题造成缓存数据为空?此时找了运维同学帮忙确认下是不是网络的问题,最后排查结果确实是网络没有放行,于是等待网络问题解决之后继续上线流程。

但是,网络问题虽然解决了,再次验证功能还是跟刚才一样,why?继续排查...

2)排查二

此时,再次借助Arthas,调用了refresh方法,来手动触发缓存刷新操作。

执行刷新操作,返回null,这是正常的,因为refresh返回void,此次刷新耗时在1132ms。

接着,再调前面获取缓存数据的接口:

数据出来了!!!说明权限数据接口是正常的,拉取数据是正常,接着我们就在功能上进行验证,确实都正常了。

那么问题就出在刷新方法的调用上,是否没触发或者调用者已经没调用等等情况。查看了代码之后才发现发现是使用TimerTask来定时执行任务,定时更新缓存数据。

Timer timer =newTimer(false);

timer.schedule(newRefreshTask(),10*1000L,30*1000L);

privateclassRefreshTaskextendsTimerTask{

@Override

publicvoidrun(){

reflesh();

}

}

reflesh() {

// 拉去权限数据

// 更新缓存数据

}

就是这样来维护缓存数据。那么为什么它没执行?按道理启动之后都会每30秒执行一次才对,但是为什么没有呢?

3)罪魁祸首

想必很多人知道TimerTask会存在一个问题,就是定时调度执行的方法如果没有捕获处理异常的话,那么它就会终止,基本上不会再运行了。所以应该是这个问题造成的。

那么,应该要找到它抛异常的地方才能验证我们这个问题。所以从日志里面找,最终发现:

确实是在启动不久(10秒左右)的地方,抛了NPE异常,所以这也验证了我们的问题,罪魁祸首就是它了。

4)解决:

ScheduledExecutorService executorService = 

newScheduledThreadPoolExecutor(1,

newBasicThreadFactory.Builder().namingPattern(

"schedule-task-%d").build());;

executorService.scheduleWithFixedDelay(

newRefreshTask() ,10*1000L,30*1000L, TimeUnit.MILLISECONDS);

使用ScheduledThreadPoolExecutor来定时调度刷新缓存。比TimerTask的好处就是出现异常也会继续重新定时调度。

3、总结

这种问题,虽说不是特别难的问题,但经验不是很丰富的开发人员却在日常中常会犯的,也会影响正常特性上线,造成发版阻碍,影响功能上线。

针对此次“事件”,总结一下,以免下次再犯:

1)日志,日志,要打印,要打印好。

2)尽量别用TimerTask,别踩坑,如要用一定要捕获处理好异常,一般建议使用ScheduledExecutorService代替。(阿里规约)

3)要学会使用Arthas,在紧急“救火”中非常有用!

此“事故”真实发生,若有雷同,实属巧合。:)

推荐阅读

互联网Code Review最佳实践分享

dubbo面试题!会这些,说明你看懂了dubbo源码

Kafka面试题!掌握它才说明你真正懂Kafka

Netty 5.0为啥被舍弃?原因竟然是...

中台之上——业务架构系列【汇总】

必备瑞士军刀IDEA插件,你使用了哪些

加入:互联网基础/架构交流 &群

-关注搬运工来架构,与优秀的你一同进步-

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,843评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,538评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,187评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,264评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,289评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,231评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,116评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,945评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,367评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,581评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,754评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,458评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,068评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,692评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,842评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,797评论 2 369
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,654评论 2 354

推荐阅读更多精彩内容