storm消息流传线程模型

笔者在测试使用storm时,意外的出现了oom,后台报错如下

导出堆,进行分析时,发现如下:



要分析此问题,首先要知道storm内部的消息传递线程模型到底是什么样的,此时的storm正在进行2.0的开发,虽然还没有发版,但是内核部分,storm已经基本都改成了java实现,github地址:

https://github.com/apache/storm/

根据官网的介绍可知,storm的消息流动是从worker(worker是storm的task节点运行的逻辑节点)开始的,我们先从worker开始分析storm的消息流动,官网介绍如下:

http://storm.apache.org/releases/2.0.0-SNAPSHOT/Message-passing-implementation.html

worker的start方法内,进行了很多工作的处理,包括worker与其他worker节点的连接建立,本地task节点的监控,与supervisor的心跳发送,其中与tuple传输相关部分的代码:


其中workerState的初始化:


workerState是非常重要的一个类,是专门处理底层传输的,并且一个worker内只有一个,由worker内的spout,bolt实例共享。

workerState也会保存根据配置worker内的executor,taskId。


1,mkExecutor这个方法会生成系统配置里已定的boltExecutor以及 SpoutExecutor实例,我们在这里也可以看到,

每个实例内引用的都是同一个workerState方法,

2,Executor的idToTask是一个Map的结构,表明了这个executor负责执行哪些task实例。

3,mkexecutor之后,马上对返回的这个executor实例,执行了execute:


我们可以认为,其中的Utils.asyncLoop()对executorTransfer的call方法进行了无线循环处理。

说白了,execute方法的执行,就是系统起了一个单独的线程,一直调用executorTransfer的call方法,

同时,不管是spoutExecutor还是BoltExecutor,每一个executor都有一个executorTransfer。


下面我们来看executorTransfer的call方法,到底做了什么


可以简单理解为,call方法对私有的batchTransferQueue进行消费,如果batchTransferQueue有数据了,则保存消费索引,对已消费的数据重新组装,丢到workerState里,让workerState负责传输给目的task。


这里的WorkerState实例,是构造Exexutor时传入的,还是worker内生成的那个,workerState实例,整个Worker就一个。

这是为什么呢? 我们看下workerState的transfer方法


其中:


workerState在传输时,上层调用会组装好数据包AddressTuple,表明一个tuple,发送给哪个目的地。所以可以认为workerState是专门负责底层传输的工作类,他不管谁给我的数据,只要指明了目的地,我就帮你传输。

这里workerState内部使用了一个使用基于Disruptor打造的并发框架队列来保存需要传输的消息。


worker内的这段程序表明了,workerState内的transferQueue一旦有数据,则会调用自身的sendTuplesToRemoteWorker方法进行远程传输,顺便说一句,此处目前是使用netty实现远程数据的传输。

上述是storm消息流程模型的部分代码解读,笔者研读了相关部分,大致画了一个草图如下



有了大致的消息流动流程,我们再来分析,上面的堆内存oom现象,根据图可知,堆内有900多w个taskMessage对象,排名第二的是

AddressedTuple,我是bolt节点出的异常,所以我们从上面线程模型图的最下面开始分析:


我们看这个Worker内的registerCallBacks()

这个方法实现了启动nettyserver后,收到数据包之后调用workerState的传输方法进行数据传输

transferLocal方法会把每一个数据包,发布到对应的目的缓冲队列,目的缓冲队列就是每个BoltExecutor或SpoutExecutor内部维护的,根据上图可见tuple之后的流向。



此处我们可以看到server在接受到消息后,会对元数据TaskMessage进行解码,解码后还要生成新的AddressedTuple,再由WorkerState进行传输,由此,我们可以断定,是这里出现的瓶颈,发射点发射数据太快了,bolt点根本来不及消费。

其实这也算必然的了,我写的spout点是一个死循环一直发随机数,没有任何sleep,几分钟,就是几百兆的数据量了。

不过根据此我们也可以看出,做好资源隔离,合理配置bolt,spout资源,以及自动扩容是很重要的。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,588评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,456评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,146评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,387评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,481评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,510评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,522评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,296评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,745评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,039评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,202评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,901评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,538评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,165评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,415评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,081评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,085评论 2 352

推荐阅读更多精彩内容

  • 目录 场景假设 调优步骤和方法 Storm 的部分特性 Storm 并行度 Storm 消息机制 Storm UI...
    mtide阅读 17,099评论 30 60
  • 这是一个JStorm使用教程,不包含环境搭建教程,直接在公司现有集群上跑任务,关于JStorm集群环境搭建,后续研...
    Coselding阅读 6,318评论 1 9
  • Date: Nov 17-24, 2017 1. 目的 积累Storm为主的流式大数据处理平台对实时数据处理的相关...
    一只很努力爬树的猫阅读 2,165评论 0 4
  • 一. wordCount Topology开发: 1.spout数据收集器(SentenceSpout类): 有...
    奉先阅读 1,190评论 0 0
  • 你是我爱的花 一朵澎湃的浪花 在我的内心激荡 荡起心动的波澜 你是我爱的花 一束炫丽的烟花 捆绑了我的眼眸 仿佛全...
    天瑞地安阅读 312评论 0 0