电商架构回顾之二-网关功能介绍及改造方案

前言

架构1.0版本上线后,用户量及访问量都是呈现爆发式增长。尤其在每周五推文之后,都会出现一波用户访问高峰。用户访问量的瞬间暴增,对我们的网关组件的挑战也是最大的。


网关故障

概述

18年11月2号和11月9号这两天,都出现用户访问量突然暴增的情况,在这种情况下,我们的网关组件都出现的故障。导致部分用户无法访问我们的接口服务。

现象及原因分析

当gateway不可用时,会打印大量如下的日志信息⬇️⬇️⬇️

2018-11-09 18:27:09 [reactor-http-nio-1] ERROR org.springframework.boot.autoconfigure.web.reactive.error.DefaultErrorWebExceptionHandler- Failed to handle request [POST http://api.
com/account/login]
io.netty.handler.codec.EncoderException: java.lang.IllegalStateException: unexpected message type: DefaultHttpRequest
        at io.netty.handler.codec.MessageToMessageEncoder.write(MessageToMessageEncoder.java:106) ~[netty-codec-4.1.23.Final.jar!/:4.1.23.Final]
        at io.netty.channel.CombinedChannelDuplexHandler.write(CombinedChannelDuplexHandler.java:348) ~[netty-transport-4.1.23.Final.jar!/:4.1.23.Final]
        at io.netty.channel.AbstractChannelHandlerContext.invokeWrite0(AbstractChannelHandlerContext.java:738) ~[netty-transport-4.1.23.Final.jar!/:4.1.23.Final]
        at io.netty.channel.AbstractChannelHandlerContext.invokeWrite(AbstractChannelHandlerContext.java:730) ~[netty-transport-4.1.23.Final.jar!/:4.1.23.Final]
        at io.netty.channel.AbstractChannelHandlerContext.write(AbstractChannelHandlerContext.java:816) ~[netty-transport-4.1.23.Final.jar!/:4.1.23.Final]



网上的解释

According to our tests the highest probability when onCompete() for client requests is not called happens in the following conditions:
1.HttpClient receives HTTP error response, 404 in our case. Most likely the error code value might be any. However, with 200 code everything seem to work fine.
2.HttpClient uses HTTPS to connect a server. With HTTP it seems to work well, or at least the probability to fail is much lower. The only explanation coming to our minds is that HTTPS uses chuncked encoding, while HTTP sets content length and thus someone tracking end of package upload operation properly calls onComplete.
3.One more thing, the uploaded content in HTTP request should be greater than some value. E.g. uploading 200 bytes file works fine, while 2MBs file reproduces the case almost immediately.
https://github.com/reactor/reactor-netty/issues/177
https://github.com/spring-cloud/spring-cloud-gateway/issues/228

我们发现这个问题是SpringCloud Gateway的bug造成的,大致的原因应该是在一些异常场景下,connection已经broken了,但是没有立即回收掉,导致broken的connectioin还被继续使用。
我们当前使用的Springboot版本是2.0.1.RELEASE。经过在测试环境反复的压测后,我们将版本升级到2.0.4.RELEASE,这个问题暂时得到的解决。

思考

前期的架构选型中,对组件的稳定性考虑不够。SpringCloud Gateway作为一个全新的组件出来,在还没有经过大量实践的考验下,直接使用,其实风险是很大的。我们要承担新组件内部版本快速升级过程中,和其他组件的版本兼容性问题,还有就是新版本会不会引发新的bug的问题呢?基于对SpringCloud Gateway版本稳定性的担忧,我们决定将网关组件进行重新的选型和改造。


网关功能介绍

在介绍网关改造方案之前,先大概说明一下现有网关都包含了哪些功能。这个可以帮忙我们在后续网关选型上提供一些参考的方向。

网关功能组成

  • JWT 校验
  • 访问权限控制
  • 请求动态路由转发
JWT 简介

JWT是一种用于双方之间传递安全信息的简洁的、URL安全的表述性声明规范。JWT作为一个开放的标准(RFC 7519),定义了一种简洁的,自包含的方法用于通信双方之间以Json对象的形式安全的传递信息。因为数字签名的存在,这些信息是可信的,JWT可以使用HMAC算法或者是RSA的公私秘钥对进行签名。

JWT 适用场景
  • 身份认证
    当用户成功登录后,后端会颁发一个JWT,在接下来的每个请求中包含JWT,网关就可以根据请求中JWT来判断用户的合法性。由于它的开销非常小,可以轻松的在不同域名的系统中传递。
JWT 组成
image.png

由上图可以看到,JWT由三个部分组成

  • header(头部信息)
    头部信息中包含了token的类型和所使用到加密算法。经过base64编码后,作为JWT的一部分。
  • payload(内容信息)
    这里包含了实际需要使用的用户信息。 一般包括用户名、用户id、过期时间等信息。
  • signature(签名信息)
    signature=header(base64) + payload(base64) + secret
JWT 使用技巧

JWT生成策略

  • 方案一:Token过期后,再重新触发登录逻辑,登录成功重新颁发新的Token给前端。
    这种方案每次token都需要让用户重新走一次登录流程,安全性有保证。但是频繁的用户重登录会降低用户的体验,所以token的过期时间不能设置太短。一般建议设置3~7天比较合适。

  • 方案二:Token过期后,重新生成新的Token并直接颁发给前端。
    这种方案对用户来说完全是无感的,token可以设置成5分钟就失效。失效后,等待下一次访问了又在重新颁发一个token。这种方案的有点就是用户体验更好,但是无法确定用户的合法性,当非法用户拿到token后,可以随意使用,而不需要在进行任何登录判断。

访问控制

在网关层面针对API设置了不同的访问权限控制

动态路由转发
网关路由请求简图.png

网关改造

选型考虑

网关作为所有流量的入口,要求必须是高并发的、稳定的、并且是经过大量验证的。经过住性能和稳定性考验的,首选肯定就是nginx,或者是基于nginx搭建的产品。

nginx
nginx基于C语言实现,采用的非阻塞模型能轻松支持大量并发连接数。但作为网关来使用,除了性能高,同时还需要具备良好的可扩展性,包括上文提到的限流、鉴权、监控、路由等等。

Openresty
基于nginx+lua实现的高性能web平台。其内部集成了大量优秀的lua库,开发者也可以基于自身的需求来实现自己的lua脚本,非常适合用来做一些高性能的web应用、网关。

最终选择了Openresty,这个主要还是根据我们目前的业务量和开发成本综合考虑的结果。其实,业界还有像Kong、Orange这些基于Openresty搭建的网关产品,他们提供的组件更加丰富,能力更强大。 但最终我们没选择,其实也没什么原因,就是觉得Openresty已经足够能满足我们,所以就选择了Openresty。

解决方案

  • JWT 校验 —> 集成jwt nginx模块
  • 访问权限控制 —> 自编lua脚本
  • 路由转发 —> consul-template

简单说明
Openresty提供了jwt的模块,我们只需要基于jwt来简单实现我们对token合法性校验和异常处理逻辑即可;路由转发Nginx提供了upstream的模块来实现,但是我们需要基于consul来实现一套动态生成upstream的机制,这里我们选择了Consul-template.

Consul-template

是Consul官网提供的模块,可以基于Consul实现自动替换配置文件的应用。

处理流程

Consul-Template流程

完整教程入口:https://www.jianshu.com/p/6534ac03ab28

结束语

网关改造耗时1个月时间完成。部署上线后到现在已经快1年了,再没出现过因为网关故障而导致服务不可用的情况了。

参考资料

openresty:http://openresty.org/cn/
jwt:https://www.jianshu.com/p/576dbf44b2ae
consul-template:https://www.hi-linux.com/posts/36431.html

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 222,183评论 6 516
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,850评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,766评论 0 361
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,854评论 1 299
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,871评论 6 398
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,457评论 1 311
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,999评论 3 422
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,914评论 0 277
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,465评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,543评论 3 342
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,675评论 1 353
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,354评论 5 351
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 42,029评论 3 335
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,514评论 0 25
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,616评论 1 274
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 49,091评论 3 378
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,685评论 2 360