【编者的话】本文是“NGINX应用性能优化指南”系列文章的第一篇,主要介绍了如何通过时间消耗分析实现NGINX应用性能优化。
注:本文最初发布于MaxCDN博客,InfoQ中文站在获得作者授权的基础上对文章进行了翻译。
正文
在深入讨论细节之前,我们先考虑下从哪里优化以及为什么优化可能让一个富内容Web应用发生有意义的转变。
相关厂商内容
通过demo学习OpenStack开发所需的基础知识 — 软件包管理
往返时间 (RTT)
RTT是一个最重要的变量,因为它既能影响延迟,又能影响吞吐量。其影响体现在客户端请求的全部三个阶段:初始连接建立时间、请求-响应延迟和响应正文传送吞吐量。
新建一个HTTPS连接包括DNS查询(通常小于10毫秒)、TCP握手和TLS隧道协商。一旦HTTPS连接建立,每个请求/响应都会(至少)再需要一个RTT。你数一下就会知道,一个新建连接上的单个HTTPS请求最少需要4个RTT:
注意:如果要发送的数据大于TCP拥塞窗口,那么可能还需要额外的往返。事实上,要发送的大量初始化数据可能对TCP事务的两个方向均有影响:一方面是客户端请求大小(比如较大的POST),一方面是服务器TLS认证链和服务器响应正文。
最后,不要忘记,TCP吞吐量与RTT是成反比的。其他条件相同的话,RTT加倍则TCP吞吐量减半。为此,我们需要考虑源服务器相对于客户端的位置。
从美国东海岸到美国西海岸的RTT大约为80毫秒,这是相当可观的。美国东海岸到亚洲的RTT达到了令人厌烦的程度,取决于所用路由的不同,在150毫秒到400毫秒之间。而且,在出现网络拥塞时,端点之间的RTT可能会增加(bufferbloat)并大幅抖动(jitter)。
按照O’Reilly出版的《高性能浏览器网络》一书的介绍,如果一个应用程序设计供人使用,那么就必须考虑人的时间感知。因此,我们应该竭力在250毫秒之内提供可视化反馈,以吸引用户的注意力——既可以是展示静态内容,开始视频播放,也可以是确认行动请求。
另一方面,如果你正在使用CDN,而且它有一个接入点(POP)距离你的终端用户比较近,那么RTT会非常低,大约5到15毫秒。可缓存内容将从CDN边缘节点中获取,浏览器和移动应用可以在动态内容还在从上游获取时就开始渲染,提高了用户感受到的响应性。
相关教程:什么是内容缓存?
为了节省同源服务器建立连接的时间,CDN边缘节点通常会保持长连接——同浏览器使用HTTP/1.1头Connection: keep-alive保持长连接是一个意思。事实上,部分CDN甚至提供了一种分层的中间节点层次结构,用于提高持久连接的可扩展性和连接故障。MaxCDN使用Origin Shield做这件事。
如果你还没有使用CDN,那么你就只能受到源服务器的RTT支配。但是,你可以使用与浏览器和CDN同样的技巧来改善RTT。下面是其中部分技巧:
使用构建在移动应用中的静态内容缓存;
让应用同源服务器保持随时可用的连接;
在世界各地部署新的源服务器;
在源服务器中使用具备内容缓存、内容转发和负载均衡特性的NGINX反向代理。
Ilya Grigorik的博文“借助预连接减少往返”是一篇相当不错的文章。虽然本指南主要讨论浏览器和Web应用,但同样的概念可以供移动应用开发人员使用。
此外,从1.9.5版本开始,NGINX提供了HTTP/2支持。这是避免连接建立时间的最好方式,因为HTTP/2在单个隧道中执行所有请求。(额外的好处:不需要修改HTTP/1.1应用程序的语义。)当然,为了充分利用HTTP/2,你必须放弃使用“域名碎片(domain sharding)”,这是一种绕过浏览器最大端点连接上限的传统技巧。
请求处理时间(RPT)
对于简单应用而言,服务器端处理可能很快,但请求需要数百毫秒甚至更长时间才能返回也很常见。取决于请求性质的不同,这可能大相径庭。
脚本和数据库查询优化是容易处理的问题,但应用程序设计优化可能会让你更上一层楼。技巧是寻找方法将阻塞等待变成并行工作。
最后,单台应用程序服务器不足以支撑繁忙的应用。随着请求开始排队等待,处理延迟成为衡量响应时间的一个主要部分。这就是为什么在应用程序前面部署一个反向代理会彻底改变游戏规则。它会解锁“超能力”,如负载均衡、内容缓冲、内容转发和“微缓存(micro-caching)”。
总之,如果你能够找到方法解放应用服务器,那么你的时间就花的非常值。让服务器专注于业务逻辑和动态内容生成——就是这样。
响应传送时间(RDT)
我将响应传送时间大概定义为应用服务器生成响应以及传送给用户(或者CDN边缘节点)所耗费的时间。
根据我们设定的目标和我们正在构建的应用的类型,我们可以用不同的方式优化RDT。例如,一个文件共享应用可能会将下载周转时间作为关键指标。另一方面,一个实时视频流应用可能会测量向用户传送视频的前10秒所耗费的时间,以便媒体播放器开始播放。
为了改善这些指标,我们应该考虑:1)响应正文的处置和大小;2)响应正文的编码和缓存;3)服务多个用户的吞吐效率和规模效应。
查看英文原文:NGINX Application Performance Optimization:Time Spent Analysis
感谢郭蕾对本文的审校。
给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ,@丁晓昀),微信(微信号:InfoQChina)关注我们。
【ArchSummit深圳2016】15大精彩专题,20位大咖讲师,驭势科技联合创始人CEO吴甘沙、Twitter机器学习基础设施组技术负责人郭晓江、腾讯平台技术运营总监徐勇州、石墨文档创始人吴洁..各大技术大咖齐聚ArchSummit,最精彩的技术切磋从这开始,八折门票倒计时,详情请点击这里。