限流模式(Throttling pattern)

控制应用程序的某个实例,某个独立的租户,或者某个整个服务对资源的消费。即使当需求增加而导致对资源的大量负载时,该模式也能够允许系统继续工作并满足SLA(服务等级协议)。

场景

云应用程序的负载经常依据活跃用户的数量或用户活动的类型而随着时间变化。例如,很多用户可能在工作时间活跃,或者在每个月月底的时候,可能会要求系统去处理开销很大的计算分析。也可能会存在突发的和意料之外的活动上的爆发点。如果系统的处理请求超出可用资源的容量,系统性能将会下降,并且甚至会发生故障。如果系统必须满足某个服务等级协议,这样的故障是不能够被接受的。

根据应用程序的业务目标,有很多策略可以用来处理云端上的负载变化。一个策略是使用自动扩展来满足特定时间上用户对于资源供给需求。当优化运行时成本时,该策略有持续满足用户需求的潜力。然而,当自动扩展可以触发额外资源的供给时,这种供给不是立即的。如果需求快速增加,会存在一个资源不足的时间窗口。

解决方案

一个替代的自动扩展策略是只允许应用程序使用有限定上限的资源,当限定达到时,对应用程序限流。系统应该监控资源时如何使用的,这样才能当利用率超过阈值时,系统能够限流某个或多个用户的请求。这将会使得系统继续工作,并且满足任何存在的服务等级协议(SLAs)。

系统可以实现一些限流策略,包括:

拒绝某个在特定时间段内已经访问每秒n次以上的系统APIs的单独用户。这就要求系统计量每个租户或用户使用的资源。

禁用或降级一些非必要的服务功能,以便必要的服务能够以足够的资源无碍的运行。例如,如果应用程序是视频流输出,可以切换到某个低分辨率。

使用负载分级来平滑活动的容量。在某个多租户环境中,该方式将会减少对于每个租户的性能。如果系统必须支持混合不同SLAs的租户,对于高价值的租户的工作可能会立即被处理。对于其它租户的请求可能会被延迟,当消除了待办任务时,才去处理这些请求。优先级队列模式可以用来实现这种方式。

延迟低优先级应用程序或租户的操作。这些操作可以被挂起或限制,产生一个异常来通知租户系统繁忙和该操作应该等会重试。

下图展示了应用程序使用3种特性的资源利用(内存,CPU,带宽等因素的组合)随时间变化的关系。特性是指一个功能范围,比如某个执行特定任务集合的组成部分,某个执行复杂计算的代码片段,或者某个提供服务比如内存内缓存的单元。这些特性被标识为A,B,和C。

特性曲线下方的面积就是使用该特性需要的资源;将A,B,和C的资源利用叠加起来就是总的资源利用量。

上图展示了延迟操作的影响。T1时间开始之前,分配给所有使用这些特性的应用程序的资源达到某个阈值(资源利用限制)。在此刻,应用程序有耗尽可用资源的危险。在该系统中,特性B没有特性A或特性C重要,因此它将会暂时被禁用,并且它使用的资源会被释放。在T1时间和T2时间之间,使用特性A和特性B的应用程序继续正常运行。最终,特性A和C的资源利用减少到某个时间点,在T2时间,在该时间点有足够的能力重新启用特性B。

自动扩展和限流方式也可以组合起来,这样有助于保持应用程序响应和满足SLAs。如果预期到需求仍然会很高,在系统横向扩展时,限流会提供一个临时的解决方案。在此刻,系统全部功能可以被恢复。

下图展示了运行在系统里面的全部应用程序所使用的所有资源随着时间变化关系,并且说明了限流是如何能够和自动扩展相结合的。

在T1时间,达到由资源利用的软性限制标明的阈值。在此刻,系统可以开始横向扩展。然而,如果新的资源不能立即变得可用,那么现存的资源可能会被耗尽,并且系统可能发生故障。为了防止这种情况发生,如前面所述,系统会被暂时地限流。当自动扩展完成时并且额外的资源可用了,限流就可以放宽了。

考虑点

在实现该模式时,考虑下面几点:

限流一个应用程序和使用的策略是一种架构上的决策,该决策会影响整个系统的设计。应该在应用程序设计早期阶段就考虑限流,因为将限流增加到一个已经实现的系统是很不容易的。

限流必须被快速地执行。系统必须有能力检测到活动的增加并且做出相应地反应。在负载消除后,系统也必须能够快速还原到原始状态。这要求持续地捕捉和监控相关恰当的性能数据。

如果某个服务需要暂时地拒绝用户请求,它应该返回某个特定错误码,以便于客户端应用程序明白某个操作被拒绝的原因是因为限流了。客户端应用程序可以等一段时间在重试请求。

当系统自动扩展时,限流可以被用来作为一个临时的措施。如果活动上的爆发是突然的并且预期不会很长时间,在某些情况下,最好是简单地限流,而不是去扩展,,因为扩展会增加运行时成本。

当系统自动扩展时,如果限流被用来作为一个临时的措施,并且如果资源需求增长特别快,系统可能不会继续工作——即使处于限流模式中。如果不能接受这种,考虑维护大容量的储备并且配置更有侵略性的自动扩展策略。

什么时候使用?

适合:

为了保证系统持续工作来满足服务等级协议。

为了防止某个单一租户独占应用程序提供的资源。

为了处理活动上的爆发。

为了有助于优化系统的成本,通过限制最大资源标准。

文章来源:Throttling pattern

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,723评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,003评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,512评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,825评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,874评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,841评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,812评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,582评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,033评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,309评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,450评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,158评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,789评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,409评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,609评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,440评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,357评论 2 352

推荐阅读更多精彩内容