关于JStorm反压两三事

data之道

0x01 背景


    反压概念在流式计算中非常流行,要解决的问题是短时间内业务流量剧增,数据流入速度远高于数据处理速度,会对流处理系统构成巨大负载压力,如果不能正确处理,可能导致系统运行异常。因此有效的反压机制对保障流处理系统的稳定性至关重要。

    Storm反压理念,bolt处理消息来不及的情况下会向ZK写一个节点进行反压,监听bolt上游的节点停止发送数据直到下游的bolt能够正常处理。这样的问题是数据可能出现骤降的过程,并且反压结束数据流下来之后容易导致新一次的反压,从而导致tps会一直抖动。

    Jstorm做了两级反压,第一级和storm类似,通过执行队列来监测,但是不会通过ZK来协调,而是通过Topology Master来协调。在队列中会标记high water mark和low water mark,当执行队列超过high water mark时,就认为bolt来不及处理,则向TM发一条控制消息,上游开始减慢发送速率,直到下游低于low water mark时解除反压。此外,在Netty层也做了一级反压,由于每个Worker Task都有自己的发送和接收的缓冲区,可以对缓冲区设定限额、控制大小,如果spout数据量特别大,缓冲区填满会导致下游bolt的接收缓冲区填满,造成反压。

本文主要介绍task接收和发送反压实现。

0x02 emit反压实现


    spout/bolt要向下游发射消息,就调用Collect.emit方法,该方法分两步实现:

1、把emit的消息缓存到task内部的消息队列(send Buffer),在缓存时判断队列是否处在反压状态,如果在反压状态,就一直循环等待直到队列降到低水位; 如果缓存消息后队列达到高水位,就标识该队列存在状态。

缓存队列大小由topology.executor.send.buffer.size参数控制。

    2、后台发送线程异步的从缓存队列拿消息,然后通过NettyClient发送。NettyClient会一直等待直到下游task(targetTask)解除反压才通过socket发送消息。获取下游task状态有两种方式:第一种根据Netty Server端response判断;第二种Topology Master发送的控制消息。

如果下游task发生反压,NettyClient就不会从send buffer里取数据向下游发送,在不断emit时,会导致send buffer达到高水位,进而emit产生阻塞(一直等待send buffer降到低水位)。

0x03 receive反压实现


    NettyServer处理NettyClient发送请求,也是分两步走:

1、server接收到client发送的消息后,先把消息放到接收缓存队列。同样消息缓存后也要判断队列是在高水位,如果队列达到高水位,返回给client端该task处在反压状态、并发送控制消息

    topology.executor.receive.buffer.size参数控制接收端缓存队列大小。

2、后台线程(BoltExecuts)从缓存队列拿消息,然后把event封装成tuple传递给Bolt的execute方法。

    如果bolt execute方法执行时间过长,会导致Executs线程从队列拿消息速度变慢,在上游task emit速度不变的情况下,缓存队列就会达到高水位,最终导致该task触发反压。

   emit和receive的整个反压过程:

0x04 相关参数


    topology.backpressure.enable:开启反压

    topology.backpressure.water.mark.low:低水位,当队列使用量低于这个量时,认为可以解除阻塞,默认值0.2

    topology.backpressure.water.mark.high:高水位,当队列使用量超过这个值时,认为阻塞,默认值0.8

0x05 后记


    JStorm的消息发送和接收都加了消息队列,本质上是生产消费模型,这样设计能降低系统对某个组件的依赖性,提高整体性能。如果对生产消费模型进行限流,JStorm反压机制很有参考意义,提供一种实现思路。通过水位检测队列过载风险,也是个很巧妙高效的设计。

本文首发于公众号:data之道

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,335评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,895评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,766评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,918评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,042评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,169评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,219评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,976评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,393评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,711评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,876评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,562评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,193评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,903评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,142评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,699评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,764评论 2 351

推荐阅读更多精彩内容

  • 目录 场景假设 调优步骤和方法 Storm 的部分特性 Storm 并行度 Storm 消息机制 Storm UI...
    mtide阅读 17,095评论 30 60
  • 一、Storm简介 Storm是一个免费并开源的分布式实时计算系统。利用Storm可以很容易做到可靠地处理无限的数...
    达微阅读 908评论 0 3
  • Storm入门系列之一:storm核心概念及特性 本文的将介绍一些 storm 入门的基础知识,包括 storm ...
    zhaif阅读 3,100评论 0 17
  • Date: Nov 17-24, 2017 1. 目的 积累Storm为主的流式大数据处理平台对实时数据处理的相关...
    一只很努力爬树的猫阅读 2,165评论 0 4
  • 二十岁。 十五岁。父亲永远离开我。亲人只剩下母亲和我哥。 18岁。读大学。19岁。经历人生中最难以言语的一件事。 ...
    CR7_1996阅读 206评论 0 0