tomcat真正做到零拷贝文件下载的使用方式及原理解析

前言

  • 本文所说的零拷贝指的是操作系统层面的零拷贝,不是应用层自身对数据复制优化的零拷贝
  • 本文对零拷贝在操作系统层面上的原理不做说明,解释零拷贝原理的文章已经有很多
  • netty常说的零拷贝有两种,一方面是应用层ByteBuf的数据复制优化,一方面是FileRegion,只有FileRegion才是操作系统层面的零拷贝
  • 零拷贝需要操作系统的系统调用支持,linux中是mmap和sendfile两种系统调用,java中对应的是FileChannel.map()和FileChannel.transferTo(),如果操作系统不支持,在java中调用这两个方法也不是真正的零拷贝
  • java零拷贝的基本只存在于文件上传、文件下载、网络代理这三种应用场景,本文仅讨论文件下载,其他两种情况可以举一反三
  • 文件下载依赖FileChannel.transferTo()实现真正的零拷贝
  • 目前能查到的java tomcat工程中零拷贝的应用示例基本都是错的,比如https://www.springcloud.io/post/2022-03/zero-copy/https://springboot.io/t/topic/2147

使用tomcat普通文件下载的正确姿势(性能差,容易oom)

    @PostMapping("download")
    public ResponseEntity<byte[]> download() throws IOException {
        String filePath = "xxx";
        String fileName = "xxx";
        Path file = Paths.get(filePath);
        byte[] bytes = FileUtils.readFileToByteArray(file.toFile());
        String contentType = Files.probeContentType(file);
        if (contentType == null) {
            contentType = MediaType.APPLICATION_OCTET_STREAM_VALUE;
        }
        HttpHeaders headers = new HttpHeaders();
        headers.setContentType(MediaType.parseMediaType(contentType));
        headers.setContentDisposition(ContentDisposition.attachment().filename(fileName, Charsets.UTF_8).build());
        return ResponseEntity.ok().headers(headers).body(bytes);
    }

使用tomcat实现零拷贝文件下载的正确姿势

    @PostMapping("zeroCopyDownload")
    public void zeroCopyDownload(HttpServletRequest request, HttpServletResponse response) throws IOException {
        String filePath = "xxx";
        String fileName = "xxx";
        if (!Boolean.parseBoolean(request.getAttribute(Constants.SENDFILE_SUPPORTED_ATTR).toString())) {
            throw new MyException("unsupported");
        }
        Path file = Paths.get(filePath);
        String contentType = Files.probeContentType(file);
        if (contentType == null) {
            contentType = MediaType.APPLICATION_OCTET_STREAM_VALUE;
        }
        response.setContentType(contentType);
        response.setContentLengthLong(file.toFile().length());
        response.setHeader(HttpHeaders.CONTENT_DISPOSITION, ContentDisposition.attachment().filename(fileName, Charsets.UTF_8).build().toString());
        // 通过start/end可以实现零拷贝分片下载
        // 请求域attribute参数详见 https://tomcat.apache.org/tomcat-10.1-doc/api/org/apache/coyote/Constants.html
        request.setAttribute(Constants.SENDFILE_FILENAME_ATTR, filePath);
        request.setAttribute(Constants.SENDFILE_FILE_START_ATTR, 0L);
        request.setAttribute(Constants.SENDFILE_FILE_END_ATTR, file.toFile().length());
    }

    // tomcat源码Http11Processor.prepareSendfile如下,使用上面设置的attribute构建sendfileData
    private void prepareSendfile(OutputFilter[] outputFilters) {
        String fileName = (String) request.getAttribute(org.apache.coyote.Constants.SENDFILE_FILENAME_ATTR);
        if (fileName == null) {
            sendfileData = null;
        } else {
            // No entity body sent here
            outputBuffer.addActiveFilter(outputFilters[Constants.VOID_FILTER]);
            contentDelimitation = true;
            long pos = ((Long) request.getAttribute(org.apache.coyote.Constants.SENDFILE_FILE_START_ATTR)).longValue();
            long end = ((Long) request.getAttribute(org.apache.coyote.Constants.SENDFILE_FILE_END_ATTR)).longValue();
            sendfileData = socketWrapper.createSendfileData(fileName, pos, end - pos);
        }
    }

    // tomcat源码NioEndpoint.processSendfile简略版如下,调用transferTo将sendfileData传输到SocketChannel中
    public SendfileState processSendfile(SelectionKey sk, NioEndpoint.NioSocketWrapper socketWrapper, boolean calledByProcessor) {
        NioEndpoint.SendfileData sd = socketWrapper.getSendfileData();
        NioChannel sc = socketWrapper.getSocket();
        // TLS/SSL channel is slightly different,https因为一定要把数据读取到应用侧校验,所以无法使用零拷贝
        WritableByteChannel wc = ((sc instanceof SecureNioChannel) ? sc : sc.getIOChannel());
        long written = sd.fchannel.transferTo(sd.pos, sd.length, wc);
        if (written > 0) {
            sd.pos += written;
            sd.length -= written;
            socketWrapper.updateLastWrite();
        }
    }

使用tomcat文件下载的常见错误做法

Channels.newChannel()创建出来的是WritableByteChannelImpl对象,零拷贝传输并不支持该类型

    @PostMapping("download")
    public void download(HttpServletResponse response) throws IOException {
        String filePath = "xxx";
        String fileName = "xxx";
        Path file = Paths.get(filePath);
        String contentType = Files.probeContentType(file);
        if (contentType == null) {
            contentType = MediaType.APPLICATION_OCTET_STREAM_VALUE;
        }
        try (FileChannel fileChannel = FileChannel.open(file)) {
            WritableByteChannel outChannel = Channels.newChannel(response.getOutputStream());
            long size = fileChannel.size();
            response.setContentType(contentType);
            response.setContentLengthLong(size);
            response.setHeader(HttpHeaders.CONTENT_DISPOSITION, ContentDisposition.attachment().filename(fileName, Charsets.UTF_8).build().toString());
            for (long position = 0; position < size; ) {
                position = position + fileChannel.transferTo(position, size - position, outChannel);
            }
        }
    }

FileChannel.transferTo的实现解析(sun.nio.ch.FileChannelImpl中实现)

就不详细看代码了,只看主体逻辑,这里也能解释为什么说上面那种调用fileChannel.transferTo的方法并不是零拷贝,因为目标channel是WritableByteChannelImpl,最终只会调用到transferToArbitraryChannel

transferTo方法中会依次尝试调用下面三个方法
// 仅支持目标channel是FileChannel和SelChImpl(SocketChannel、ServerSocketChannel)
// 最终调用native方法transferTo0,不同操作系统实现不一样
transferToDirectly();
// 仅支持目标channel是FileChannel
// 调用FileChannel的map方法最终调用native方法map0获得MappedByteBuffer,然后写入
transferToTrustedChannel();
// 最普通的做法,现在应用侧读取文件内容再写入,
transferToArbitraryChannel();

transferTo0的native实现解析(以jdk8为例)

可以看到linux和mac是支持的(也无法保证每个版本都支持),window不支持。这也体现了即使使用了正确的目标channel类型,可以最终调用到transferTo0的native方法也无法保证一定是零拷贝,还要看运行的操作系统是否支持

// *nux实现https://github.com/openjdk/jdk/blob/jdk8-b120/jdk/src/solaris/native/sun/nio/ch/FileChannelImpl.c
Java_sun_nio_ch_FileChannelImpl_transferTo0(JNIEnv *env, jobject this,
                                            jint srcFD,
                                            jlong position, jlong count,
                                            jint dstFD)
{
#if defined(__linux__)
    // 省略
    jlong n = sendfile64(dstFD, srcFD, &offset, (size_t)count);
#elif defined (__solaris__)
    // 省略
    result = sendfilev64(dstFD, &sfv, 1, &numBytes);
#elif defined(__APPLE__)
    // 省略
    result = sendfile(srcFD, dstFD, position, &numBytes, NULL, 0);
#else
    return IOS_UNSUPPORTED_CASE;
#endif
// windows实现https://github.com/openjdk/jdk/blob/jdk8-b120/jdk/src/windows/native/sun/nio/ch/FileChannelImpl.c
Java_sun_nio_ch_FileChannelImpl_transferTo0(JNIEnv *env, jobject this,
                                            jint srcFD,
                                            jlong position, jlong count,
                                            jint dstFD)
{
    return IOS_UNSUPPORTED;
}

总结

  • 只有使用正确的目标channel(FileChannel/SelChImpl的实现类),运行在支持的操作系统上,我们的java代码才可以真正的零拷贝实现文件下载
  • 并不建议使用tomcat来做真正的文件服务(当然如果文件较小,请求量不大也可以用),开发者无法控制文件的读取写入,完全被tomcat托管了。真正的文件服务还是推荐用netty自己开发,可以保证文件读取写入的完全可控 ,用好netty的FileRegion
  • 大多数开发者仅仅是在操作系统层面了解零拷贝的原理,实际应用中因为不了解jvm对系统调用的包装,会想当然的误以为只要调用了FileChannel的transferTo方法就一定是零拷贝。https://www.springcloud.io/post/2022-03/zero-copy/https://springboot.io/t/topic/2147 这两个文章可能误导了非常多人
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,039评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,223评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,916评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,009评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,030评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,011评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,934评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,754评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,202评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,433评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,590评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,321评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,917评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,568评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,738评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,583评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,482评论 2 352

推荐阅读更多精彩内容