POI 内存溢出问题分析

问题背景

微服务架构,当前微服务启动参数-Xmx125m。微服务各自内嵌tomcat,启动时调用tomcat 的jar包,加载业务jar包及其依赖jar包。并配置了-XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=$TOMCAT_LOG_DIR ,在运行过程中监控到OutOfMemoryError。

image

报错信息

首先获取日志信息:

java.lang.OutOfMemoryError: Java heap space
    at org.apache.poi.hssf.usermodel.HSSFRow.createCellFromRecord(HSSFRow.java:204) ~[poi-4.0.1.jar:4.0.1]
    at org.apache.poi.hssf.usermodel.HSSFSheet.setPropertiesFromSheet(HSSFSheet.java:240) ~[poi-4.0.1.jar:4.0.1]
    at org.apache.poi.hssf.usermodel.HSSFSheet.<init>(HSSFSheet.java:148) ~[poi-4.0.1.jar:4.0.1]
    at org.apache.poi.hssf.usermodel.HSSFWorkbook.<init>(HSSFWorkbook.java:356) ~[poi-4.0.1.jar:4.0.1]
    at org.apache.poi.hssf.usermodel.HSSFWorkbook.<init>(HSSFWorkbook.java:401) ~[poi-4.0.1.jar:4.0.1]
    at org.apache.poi.hssf.usermodel.HSSFWorkbook.<init>(HSSFWorkbook.java:382) ~[poi-4.0.1.jar:4.0.1]
    at com.xxx.xxx.xxx.xlsio.XlsReader.read(XlsReader.java:45) ~[classes/:?]
    at com.xxx.xxx.xxx.xlsio.XlsService.export(XlsService.java:18) ~[classes/:?]
    at com.xxx.xxx.xxx.impl.ExportServlet.exportInternal(ExportServlet.java:162) ~[classes/:?]
    at com.xxx.xxx.xxx.impl.ExportServlet.doPost(ExportServlet.java:79) ~[classes/:?]
    at javax.servlet.http.HttpServlet.service(HttpServlet.java:650) ~[servlet-api.jar:?]
    at javax.servlet.http.HttpServlet.service(HttpServlet.java:731) ~[servlet-api.jar:?]
    at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:303) ~[catalina.jar:7.0.91]
    at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:208) ~[catalina.jar:7.0.91]
    at org.apache.tomcat.websocket.server.WsFilter.doFilter(WsFilter.java:52) ~[tomcat7-websocket.jar:7.0.91]
    at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:241) ~[catalina.jar:7.0.91]
    at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:208) ~[catalina.jar:7.0.91]
    at com.xxx.xxx.common.tokenhelper.filter.AuthFilter.authTokenByExpression(AuthFilter.java:263) ~[com.xxx.xxx.common.tokenhelper-7.303.119.jar:?]
    at com.xxx.xxx.common.tokenhelper.filter.AuthFilter.uniAuthToken(AuthFilter.java:203) ~[com.xxx.xxx.common.tokenhelper-7.303.119.jar:?]
    at com.xxx.xxx.common.tokenhelper.filter.AuthFilter.doFilter(AuthFilter.java:119) ~[com.xxx.xxx.common.tokenhelper-7.303.119.jar:?]
    at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:241) ~[catalina.jar:7.0.91]
    at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:208) ~[catalina.jar:7.0.91]
    at org.springframework.security.web.FilterChainProxy$VirtualFilterChain.doFilter(FilterChainProxy.java:320) ~[spring-security-web-5.0.12.RELEASE.jar:5.0.12.RELEASE]
    at org.springframework.security.web.header.HeaderWriterFilter.doFilterInternal(HeaderWriterFilter.java:74) ~[spring-security-web-5.0.12.RELEASE.jar:5.0.12.RELEASE]
    at org.springframework.web.filter.OncePerRequestFilter.doFilter(OncePerRequestFilter.java:107) ~[spring-web-4.3.20.RELEASE.jar:4.3.20.RELEASE]
    at org.springframework.security.web.FilterChainProxy$VirtualFilterChain.doFilter(FilterChainProxy.java:334) ~[spring-security-web-5.0.12.RELEASE.jar:5.0.12.RELEASE]
    at org.springframework.security.web.FilterChainProxy.doFilterInternal(FilterChainProxy.java:215) ~[spring-security-web-5.0.12.RELEASE.jar:5.0.12.RELEASE]
    at org.springframework.security.web.FilterChainProxy.doFilter(FilterChainProxy.java:178) ~[spring-security-web-5.0.12.RELEASE.jar:5.0.12.RELEASE]
    at org.springframework.web.filter.DelegatingFilterProxy.invokeDelegate(DelegatingFilterProxy.java:347) ~[spring-web-4.3.20.RELEASE.jar:4.3.20.RELEASE]
    at org.springframework.web.filter.DelegatingFilterProxy.doFilter(DelegatingFilterProxy.java:263) ~[spring-web-4.3.20.RELEASE.jar:4.3.20.RELEASE]
    at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:241) ~[catalina.jar:7.0.91]
    at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:208) ~[catalina.jar:7.0.91]

通过log看出,发生问题时业务在处理 excel的导入导出。调用了 apache.poi 库,实现excel文件的解析。

分析 .hprof 文件内容

接下来通过MAT查看hprof文件

image.png

从概况图上看,灰色区域还存在大量未使用内存,这块比较奇怪。

进一步,查看泄漏的详细报告。

可以看出,最大内存占用是TaskThread类,有11个实例,占用了70m的内存。

捕获.PNG

接下来,看一下dominator_tree视图,按照降序列出了内存中的对象。

TaskThread有10个左右,每个对象实例占用了接近10M内存。

TaskThread 是tomcat中的类,应该是tomcat为请求分配的线程。

image.png

展开TaskThread下面的节点。其中HSSFShee占据了绝大部分内存。

由此可以判断 是多个导出excel的请求,导致系统内存溢出。

业务流程

接下来通过业务代码分析一下,发生问题的业务流程。

此处是一个导出excel的接口。 通过请求一个id的列表,将相关数据导出到excel中,返回。

详细过程是:先读取一个excel的模板文件中,然后根据id到数据库中查询数据,然后将内容追加到读取的模板文件中,最后写出到响应报文中。

验证推测

为了排除其他原因影响,验证上述结论。在本地写了一个简单的用例。读取相同的模板文件,启动10个线程,同时调用导出excel。并也将最大内存设置为125m。

通过visual vm 观察当前的实时内存,发现和预期相同,内存上升到了100以上。并在控制台输出了OutOfMemoryError堆栈。

捕获.PNG

分析问题

通过业务日志发现,请求导出的数据量并不大,只有1两条。

而模板excel文件 大小是760kb。poi读取整个760kb文件,如果没有使用特殊的压缩算法,消耗了1m左右内存,应该也是合理的。所以并发的10此请求,会导致内存到达上限,溢出。

打开查看excel文件,发现加上表头也只有几行左右数据。但是下面有大量带颜色的空单元格,共1000行左右。从excel存储方式角度考虑,虽然内容为空,但是单元格本身是存在的,所以也会暂用空间。

解决问题

删除下方的1000多行只有颜色的空单元格。excel的大小由760kb 降到了300kb。

然后在本地用例下测试。内存降了下来。然后反复执行10次请求。内存会正常进行垃圾回收,不会导致内存溢出了。

image.png

思考

当前测试条件下,通过精简excel模板文件大小,可以很明显的降低内存。

如果业务上需要处理大尺寸的excel文件呢?

通过查询poi文档,发现poi也提供了流式处理方式,便于处理大文件。

参考

visualvm
https://visualvm.github.io/download.html
tomcat 源码
https://github.com/apache/tomcat
poi源码
 https://github.com/apache/poi

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,163评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,301评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,089评论 0 352
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,093评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,110评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,079评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,005评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,840评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,278评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,497评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,667评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,394评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,980评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,628评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,649评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,548评论 2 352