Android高速下载器实现思路——单个任务的提速与优化

前言

最近过了金三银四的金三,顺利拿到了暑假实习生的offer。实习部门leader给我布置了入职前学习任务,强化多线程、数据库方面的知识,并建议我实现一个和他们产品中类似的下载器。

实现思路

本文的重点在下载部分的实现。目前我也正在做单个任务下载开发与优化。后续更新完成后如果有好的思路也会分享给大家。
项目地址是:https://github.com/SirLYC/Yuchuan-Downloader
(处于开发中)

断点下载

首先,下载器有断点续传功能,断点续传实现的基础知识就是HTTP协议中的Range头部。比如,一个文件有500bytes,我要从第200个bytes下载,就在请求的头部添加一个key为Range的项,内容是bytes=200-。因此,在实现的时候,我们需要记录当前的下载量,在恢复下载的时候,就可以从上次的当前下载量开始下载,节省用户流量。

但是并不是所有的服务器都支持断点下载。因此,可以在正式的下载前先发一个请求,在请求中添加Range字段,顺带也可以通过这种方式获取文件长度(ContentLength首部)。

这里简单说一下下载文件的原理。在一个GET请求时,服务器首先会把头部报文全部返回给你,如果是下载文件,一般来说都是流下载,有一个标志会告诉你responseBody是流。而HTTP又是基于TCP的,这个流实际上就是TCP的流,在Java中对应的就是InputStream。流可以看作是一个只能向后走的指针,指针指向下一个待读取的字节,并且读取了一个才能读下一个。因此,如果暂停恢复不用部分请求的话,你必须得把前面下载过的字节全部接受一遍,这显然浪费了时间和流量。

多线程下载

首先要知道,多线程是基于断点下载的原理。一个文件实际上就是二进制数据,把文件拆分成多个段,每个线程下载各自的段。因此每个线程在请求时需要控制文件起始和结尾,给每一个线程分配下载的段。因此,不支持断点续传的服务器是不能用多线程下载的。

那为什么多线程下载可以提速呢?首先比较显然的一点是多线程可以利用CPU多核的特性,在相同时间内完成更多的任务。但事实上基于这一点不会提高多大的速度,因为接收端的总带宽是一定的。想象一个这个场景:


image

上面的小水管就是我们的服务端连接,每个连接限制了最大带宽。大水管就是接收端,接收端带宽一定。当我们启用一个小水管时,我们可以获得的最大流速是min(小水管、大水管)。当我们启用多个水管时,最大速度是min(小水管1+小水管2+...+小水管n,大水管)。可见,在这种场景下的多线程,瓶颈就不会再是服务端的带宽限制。

那线程是不是越多越好呢? 显然这是不对的。线程本身就是一个很重的对象,创建线程、多线程调度管理会占用CPU时间,会减少用户时间比例。另外就是多线程对内存的占用也是一个问题。因此,启动的下载线程数要有限制。

下载与写线程分开

以前写下载器时,常见的下载模式是

// 伪代码
while (data remains to read) {
    buffer = inputstream.read(bufferSize)
    outputstream.write(buffer)
}

在多线程的情况下大概是这样的


image

当时现场面试的时候我也讲下载器可以这么实现,结果面试官上来问一句,读和写真的要放在一个线程?
从目前来讲,写磁盘的速度一般都是远大于网络获取的速度的。如果我们能把写数据放在一个单独的线程里,假设3个线程以相同的速度读取相同大小的网络字节流放在缓冲区,每个线程都把各自的缓冲区送入写线程,然后又各自去读网络数据。因为我们写的速度大于网络下载速度的,因此在下一次3个缓冲区送入前是可以写完的,这样在理想情况下就节省了1次写磁盘的时间。

但在实际实现时,有很多需要注意的地方。首先下载线程不能无限制的下载。如果写线程阻塞了,下载线程还在不停下载的话,缓冲区会越来越大,造成OOM。另外就是缓冲区的交换,写线程需要拿,下载线程需要送,这是一个典型的消费者——生产者模式。这方面的实现文章就多了,最终我是选用的BlockQueue来实现。大致的流程如下:

image

上述流程中,还有很多未包括所有内容,比如错误处理,状态转换等。实际上,要写一个用户体验好,性能好的下载器是一件很不容易的事。

后续

目前,我的项目上实现的只有单任务多线程的下载,多任务、下载信息本地保存等还未实现。

除了这些以外,我还会考虑加入多进程的架构,可以实现ui退出后的离线下载。欢迎大家clone跑sample或者提一些意见!

再次挂上项目地址:https://github.com/SirLYC/Yuchuan-Downloader

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,884评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,755评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,369评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,799评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,910评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,096评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,159评论 3 411
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,917评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,360评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,673评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,814评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,509评论 4 334
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,156评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,882评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,123评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,641评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,728评论 2 351

推荐阅读更多精彩内容