记录一次SequenceInputStream引起的栈溢出StackOverflowError

前言

笔者使用http上传大文件，采用分片上传的方式，下把大文件分割成等分的小文件上传到服务器目录再合并到写入大文件中，起初应对2G以内的文件都没有问题，随着文件增大出现问题了，文件上传的状态一直merging，即小文件都传上来了，却没有合并。

分析问题

考虑到合并文件是个耗时的操作，http会响应超时，就用启动一个线程异步上传，且合并是互斥的，也就是说如果已经在合并中就不能重复提交。为了简化模型，启用了一个单线程的线程池执行合并任务，合并开始前存入merging状态，后续相同的请求进来就会拒绝，不同的请求进来就会加入到线程池的阻塞队列。

分析内存

从本机开发环境开始调试，加入jmx监控，使用jconsole和VisualVM获取内存变化情况。

-server
-Xrs
-Xmx6G
-XX:NewSize=2G
-Dcom.sun.management.jmxremote.ssl=false
-Dcom.sun.management.jmxremote.authenticate=false
-Djava.rmi.server.hostname=127.0.0.1
-Dcom.sun.management.jmxremote.port=10028

memory.jpg

如图红线圈中的部分是文件分片上传时期，黑线圈中的部分是服务器文件合并时期，明显看出分片上传时期新生代内存消耗大，频繁触发YGC；文件合并时期，内存曲线斜率变化不大与没有上传文件前相差不大，说明文件合并不会消耗多大的内存。

分析IO

由于jconsole和VisualVM无法监控磁盘IO，用的win7系统自带的磁盘监控工具。发现磁盘队列长度在合并期间长期维持在5左右，说明磁盘IO到达瓶颈。

分析线程dump

以上两项分析，说明合并文件只跟系统磁盘的IO有关系，但是去服务器上看IO情况，发现IO读写很低。说明文件合并请求很可能并没有执行。下面分析服务器jvm的线程dump。

> jstack -l pid > log.log
> vim log.log
"pool-2-thread-2" #64 prio=5 os_prio=0 tid=0x00007f931400b000 nid=0x7af5 waiting on condition [0x00007f93a8046000]
   java.lang.Thread.State: WAITING (parking)
        at sun.misc.Unsafe.park(Native Method)
        - parking to wait for  <0x00000006268ccbc0> (a java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject)
        at java.util.concurrent.locks.LockSupport.park(LockSupport.java:175)
        at java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject.await(AbstractQueuedSynchronizer.java:2039)
        at java.util.concurrent.LinkedBlockingQueue.take(LinkedBlockingQueue.java:442)
        at java.util.concurrent.ThreadPoolExecutor.getTask(ThreadPoolExecutor.java:1074)
        at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1134)
        at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
        at java.lang.Thread.run(Thread.java:748)

   Locked ownable synchronizers:
        - None

几次合并请求发现都没有执行，原来是这样的，单线程线程池，内部有个无界队列，线程忙时，就把请求放到阻塞队列中，实际上后续的合并请求并没有执行。因此看不到报错，也看不到任何反应。

创建线程执行

明白是线程池捣乱后，采用new Thread()的方式创建线程执行。结果发起合并请求日志中就暴露问题了。

Exception in thread "merge-thread-83" java.lang.StackOverflowError
    at java.io.SequenceInputStream.close(SequenceInputStream.java:232)
    at java.io.SequenceInputStream.nextStream(SequenceInputStream.java:106)
    at java.io.SequenceInputStream.close(SequenceInputStream.java:232)
    at java.io.SequenceInputStream.nextStream(SequenceInputStream.java:106)
    at java.io.SequenceInputStream.close(SequenceInputStream.java:232)
    at java.io.SequenceInputStream.nextStream(SequenceInputStream.java:106)
    at java.io.SequenceInputStream.close(SequenceInputStream.java:232)
    at java.io.SequenceInputStream.nextStream(SequenceInputStream.java:106)
    at java.io.SequenceInputStream.close(SequenceInputStream.java:232)
    at java.io.SequenceInputStream.nextStream(SequenceInputStream.java:106)
    at java.io.SequenceInputStream.close(SequenceInputStream.java:232)
    at java.io.SequenceInputStream.nextStream(SequenceInputStream.java:106)
    at java.io.SequenceInputStream.close(SequenceInputStream.java:232)
    at java.io.SequenceInputStream.nextStream(SequenceInputStream.java:106)
    at java.io.SequenceInputStream.close(SequenceInputStream.java:232)
......

jvm虚拟机栈溢出了。开始真正的分析代码。

        // 按照小文件的名称的数字顺序把小文件转成字节流，并放到SequenceInputStream内部实现的集合中，集合实际上是个Vector保存文件流的顺序。
        SequenceInputStream s ;
        InputStream s1 = new FileInputStream(mergePath + 0 + ext);
        InputStream s2 = new FileInputStream(mergePath + 1 + ext);
        s = new SequenceInputStream(s1, s2);
        for (int i = 2; i < chunksNumber; i++) {
            InputStream s3 = new FileInputStream(mergePath + i + ext);
            s = new SequenceInputStream(s, s3);
        }
        
        //通过输出流向文件写入数据
        String writeToPath = uploadFolderPath;
        if (uploadFolderPath.endsWith(ConfigConstant.File_Separator)) {
            writeToPath = uploadFolderPath.substring(0, uploadFolderPath.length()-1);
        }  

        // 开始向写入大文件
        StreamUtil.saveStreamToFile(s, writeToPath + ext);

StreamUtil.saveStreamToFile方法

public static void saveStreamToFile(@NotNull final InputStream inputStream,
                                        @NotNull final String filePath)
            throws Exception {
         /*创建输出流，写入数据，合并分块*/
        logger.info("{}: 文件‘{}’大文件流写入开始", Thread.currentThread().getName(), filePath);
        OutputStream outputStream = new FileOutputStream(filePath);
        byte[] buffer = new byte[1024];
        int len = 0;
        try {
            while ((len = inputStream.read(buffer)) != -1) {
                outputStream.write(buffer, 0, len);
                outputStream.flush();
            }
            logger.info("{}: 文件‘{}’大文件流写入成功", Thread.currentThread().getName(), filePath);
        } catch (Exception e) {
            e.printStackTrace();
            throw e;
        } finally {
            outputStream.close();
            inputStream.close();
        }
    }

文件输入流时SequenceInputStream，其类结构如图：

SequenceInputStream.jpg

SequenceInputStream调用了子类的read(b [])方法，子类调用了父类的read(byte b[], int off, int len)方法，如下图所示：

public int read(byte b[], int off, int len) throws IOException {
        if (in == null) {
            return -1;
        } else if (b == null) {
            throw new NullPointerException();
        } else if (off < 0 || len < 0 || len > b.length - off) {
            throw new IndexOutOfBoundsException();
        } else if (len == 0) {
            return 0;
        }
        do {
            int n = in.read(b, off, len);
            if (n > 0) {
                return n;
            }
            nextStream();
        } while (in != null);
        return -1;
    }

读取一个小文件流末尾时，调用nextStream()方法获取下一个文件输入流。

    final void nextStream() throws IOException {
        if (in != null) {
            in.close();
        }

        if (e.hasMoreElements()) {
            in = (InputStream) e.nextElement();
            if (in == null)
                throw new NullPointerException();
        }
        else in = null;

    }

nextStream()的第一步是关闭已经读完的文件流，但是这个SequenceInputStream的close()方法有问题。

    public void close() throws IOException {
        do {
            nextStream();
        } while (in != null);
    }

这里是循环中带有递归方法，关闭输入流前，遍历非空的输入流，有点搞不懂作者的用意何在，这里的就是刚才栈溢出时压栈的方法。这就是问题的根源

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,544评论 6赞 501
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,430评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,764评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,193评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,216评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,182评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,063评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,917评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,329评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,543评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,722评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,425评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,019评论 3赞 326
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,671评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,825评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,729评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,614评论 2赞 353