IPv6死锁导致dbcp连接池异常

问题

  1. 应用使用dbcp数据库连接池维护与oracle数据库的连接。偶尔会出现拿不到数据库连接的情况。
  2. IPv6造成死锁问题

结论

  1. dbcp配置最好研究一下官方文档
  2. 当服务器开启ipv6后,在特殊情况下,会影响性能,造成死锁。
    IBM IPV6 Can Cause Poor Java Performance
    ipv6造成的死锁问题
    java.net.preferIPv4Stack设置
    JVM源码系列: java InetAddress.getLocalHost() 在linux里实现
    浅谈getaddrinfo函数的超时处理机制
  1. 解决办法
  • JVM启动添加-Djava.net.preferIPv4Stack=true,禁用IPv6。
  • 保持 hostname/etc/sysconfig/network:HOMENAME/etc/hosts 对机器名设置的一致性

-----------------------------------------以下正文 -----------------------------------------


0. 背景

公司有条很老的业务线,这个业务线有一个很老的管理系统。该系统虽说老当益壮,但是最近不知怎么的,大错不犯小错不断,招致不同部门的投诉轰炸。

系统异常的表现很有意思,访问页面都很正常,只要一使用登录功能就抛nginx的错误页面。偶尔出现这种情况,年轻的技术人员就会快速的重启项目,又可以正常使用了。

没有一次重启解决不了的问题,如果有,那就再重启一次。

但是不巧的是,最近不同业务线的问题集中爆发,到了必须清算过往的时候了。。。

1. 收集证据

通过简单的“走访”得知,以往系统偶尔会报拿不到数据库连接的错误。结合过往日志和异常表现,判断很可能数据库连接池就是罪魁祸首。(我们数据库用oracle,连接池用dbcp。对,就是大家几乎一致认为性能不咋地的dbcp)

我们又仔细研究了官方的说明,严谨的配置了相关参数,更新上线。

2. 从头再来

第二天是周六,早上正在吃饭的时候,业务群又爆了,系统又报错了!!!!!!!!

饭是吃不成了。安抚完业务方后,赶紧把现场保存了下来。

2.1 保存现场

# 查看项目进程ID: 126904
ps aux | grep your-app

2.1.1 查看数据库连接情况

# oracle端口为1521
lsof -p 126904 -nP | grep TCP | grep 1521

结果项目进程没有到oracle的tcp连接。

2.1.2 JVM dump

# dump文件
jmap -dump:format=b,file=heap.dump 126904
# 查看堆内存情况
jmap -heap 126904 > heap.txt

2.1.3 Thread dump

# 线程运行情况
jstack 126904 > thread.txt

2.1.4 分析工具

IBM HeapAnalyzer 分析dump文件

官网地址,不太直观。

IBM Thread and Monitor Dump Analyzer for Java (TMDA) 分析线程

官网地址,也不太直观。

jhat分析dump文件 <推荐>

# 启动分析
jhat heap.dump
启动

加载完成后,访问127.0.0.1:7000即可。

fastthread.io 在线分析线程 <推荐>

官网地址,上传thread文件或者把thread信息粘贴进去,就可以自动分析。

优点是:非常直观。

image.png

2.1.5 排查过程

先做线程分析

将thread信息上传到fastthread.io,查看异常情况如下:

汇总分析

上图可以发现,有两个线程block了,有戏!

blocked线程明细

查看其中的69号和63号线程,发现是在等待<0x000000074d4c8208>对象,有戏!!!

此处,线程正在创建数据库连接,说明dbcp连接池配置没有问题

blocked线程

查看线程关系,原来是67号线程持有<0x000000074d4c8208>对象,导致创建数据库连接的线程阻塞了。

CPU消耗多的线程

上图说明,67号线程在空跑CPU,所以63和69号线程一直拿不到对象锁,创建不了数据库连接,由于连接池配置获取连接超时时间为10s,所以前端页面就会报错了。

说明,这个线程会一直运行超过10s!!!!!

定位问题代码

ibatis 2.x

image.png

2.1.6 刨根问底

dbcp连接池的嫌疑排除了,现在的问题更加棘手了。只能求助bing(墙内)。

经过曲折的过程,最终定位到IPv6的问题,通过设置jvm参数,禁用了IPv6之后,异常再没有出现过。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,509评论 6 504
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,806评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,875评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,441评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,488评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,365评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,190评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,062评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,500评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,706评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,834评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,559评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,167评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,779评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,912评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,958评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,779评论 2 354