Jstorm学习笔记(1)——原理

1.组件

Nimbus: 集群主节点，负责资源管理、任务分配
Supervisor：集群工作节点，接收任务，管理worker进程
Worker：工作进程，每个工作进程中都有多个Task线程
Task：任务，每个任务都是一个线程，执行具体的算子代码
Zookeeper：集群管理

2.工作流程

图1 工作流程

3.Topology结构

图2 拓扑结果

Spout : 数据来源(Kafka,DB...)

void open(Map, TopologyContext, SpoutOutputCollector); // 初始化操作
void close(); //关闭时操作
void activate(); //task激活时操作
void deactivate(); //task暂停时操作
void nextTuple(); //发射下一个tuple时操作
void ack(Object msgId); //ack
void fail(Object msgId); //unack

Bolt : 数据处理单元

void prepare(Map, TopologyContext); // 初始化操作
void execute(Tuple, BasicOutputCollector); //逻辑处理操作
void cleanup(); //关闭时操作

4.启动过程

根据jstorm 2.4.0版本源码整理

Nimbus

图3 Nimbus启动过程

任务调度原则(jstorm将服务器资源通过port、cpu、net、disk四个维度进行分配，按以下4个优先级分配)
· P0: 自定义分配规则
· P1: 尽量将同组件的task分配到不同的worker和supervisor上，提高拓扑稳定性 (ComponentNumSelector)
· P2: 尽量将task分配到supervisor上worker分得的线程数基本一致，保证负载均衡(TotalTaskNumSelector)
· P3: 尽量将有直接消息传输的task放到同一个worker上，保证消息走Worker进程内通信，无需序列化／反序列化，利用disruptor无锁队列提升性能(InputComponentNumSelector)

图4 任务分配例子

Supervisor

图5 Supervisor启动过程

Worker

启动过程比较简单，主要是根据分配的任务，利用反射执行指定的代码(bolt或spout)，下图是worker工作流程图

图6 Worker工作流程图

Disruptor
在jstorm中延用了storm中队列的数据结构disruptor，这是LMAX开发的用于线程间高性能通信的无锁队列，每秒可处理线程间百万级别数据，Log4J2用的也是该数据结构。JStorm也是一样注重组件流水型工作，所以使用disruptor来进行线程间通信。
画了一个草图，disruptor主要是用了一个数组（逻辑环形），一般环形数组使用取余来定位当前下标，disruptor强制要求数组大小是2的倍数，这样使用位计算定位下标会更高效。其次，ring buffer只维护一个seq，表示哪一个slot是可以被消费到的，每一个消费者自身维护一个seq标示自己消费到哪一个slot。
Consumer消费：调用waitStrategy的waitFor()方法，使用不同策略等待消费。
Producer生产：使用2PC方式，先调用next()方法cas获取自己的slot，然后获取该slot设置成自己生产的数据，最后publish()提交，表示该slot对所有消费者可见。

disruptor

PS：Disruptor为什么这么高效？
1）Ringbuffer数组使用内存预分配，减少GC
2）消除false sharing，填充缓存行
3）无锁
4）批处理效应，消费者追赶，例如生产者一瞬间生产N条消息，消费者不会一条一条请求，而是直接追赶消费到最新的seq

5.特性

Topology Master（减少zk压力，storm对zk依赖太过严重的优化）

缓解zk压力，由TM汇总后与zk/nimbus交互，在nimbus分配任务时，将TM作为系统bolt添加到等待分配的任务中（TM本质就是一个Bolt）

Metrics（采样）
Heartbeat（心跳）
Control Event（控制事件）

图7 Topology Master

反压（生产速度远大于消费速度）

Jstorm使用二级反压，使用high_water_mark,low_water_mark控制反压（当队列大小大于high_water_mark时就开始限制上游发送速度，直到队列大小小于low_water_mark才取消对上游发送速度的限制），有效避免tps抖动。以下内容可参考图6 worker工作流程图了解反压机制。

emit发送反压
1）把消息放入send buffer时，判断是否需要流控（queue是否达到high_water_mark），等待至无需阻塞
2） Netty client线程异步从send buffer取消息发送给下游时，判断是否需要流控（根据netty server端response／Topology Master发送的控制消息判断），等待至无需阻塞
receive接收反压
1）Netty Server接收到消息，缓存到recevie buffer时，判断是否需要流控（queue是否达到high_water_mark）

Acker（At least once语义）

Acker本质就是一个Bolt，源码上直接实现Bolt接口

启用方法
1）设置acker数量：conf.setNumAckers(1)，在nimbus分配任务时，将acker作为系统bolt添加到等待分配的任务中
2）spout发射tuple指定msgId（全局唯一，作为状态监控的依据）
原理（异或计算）

图8 Acker原理

1）Spout每发送一个数据都会生成一个随机的root_id，并发送ack_init事件给Acker
2）Acker使用RoatingMap数据结构(具有清除超时Object的Map)维护root_id<=>AckObject(val,spout_task,fail)
3）每一个算子都会把自己接收的上游数据和生成的下游数据做异或计算发送给Acker。如bolt接收了上游r1产生了下游r3，则给Acker发送<root_id,r1^r3>；如bolt接收了上游r2，没有生成下游，则给Acker发送<root_id,r2>。直到某一时刻root_id的val为0时说明这个数据被所有的bolt处理完毕。
4）如何判断处理失败？上面提到Acker使用RoatingMap数据结构(具有清除超时Object的Map)维护root_id<=>AckObject，当Acker接收到非ack_init事件，并且在RoatingMap中找不到对应的AckObject，则表示超时

Exactly-Once语义

Chandy-Lamport Algorithm exactly-once语义

(1) 管理者A发起一次snapshot:向所有source发送屏障

(2) B屏障到达D，此时D不会保存state，阻塞等待C屏障(stream align(流对齐))

(3) 在D收到C屏障之前，将BD数据存入input buffer，并继续处理CD数据

(4) C屏障到达(checkpoint)

(5) D保存state，说明D已经处理完5之前的数据，并发送给下游新的屏障
Chandy-Lamport Algorithm at least once 语义
如果上面的exactly-once语义缺少了流对齐过程则变成at least once 语义

(1) D收到B屏障，不阻塞等待C屏障(缺少流对齐过程)

(2) 如果此时回滚，D保存的state应该是消费了1,2,3,4,5，此时6就会被重发
Jstorm实现
1）角色
· spout（数据源）
· non-stateful bolt（状态无关节点）
· stateful bolt（状态节点，做流对齐以及状态保存）
· end bolt（结束节点）
2）流程

图9 exactly-once语义

3）缺少流对齐的At least once 与 Acker At least once对比，发现新框架相比Acker实现At least once性能更高，应该是避免了各个算子频繁与acker通信产生的优势

image.png

最后编辑于：2019.04.08 18:21:53

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 225,271评论 6赞 524
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 96,533评论 3赞 405
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 172,580评论 0赞 370
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 61,203评论 1赞 303
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 70,204评论 6赞 401
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 53,664评论 1赞 316
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 42,014评论 3赞 431
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 40,991评论 0赞 280
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 47,536评论 1赞 326
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 39,558评论 3赞 347
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 41,678评论 1赞 355
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 37,267评论 5赞 351
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 42,997评论 3赞 341
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 33,429评论 0赞 25
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 34,580评论 1赞 277
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 50,259评论 3赞 382
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 46,744评论 2赞 366

Jstorm学习笔记(1)——原理

1.组件

2.工作流程

3.Topology结构

4.启动过程

Nimbus

Supervisor

Worker

5.特性

Topology Master（减少zk压力，storm对zk依赖太过严重的优化）

反压（生产速度远大于消费速度）

Acker（At least once语义）

Exactly-Once语义

推荐阅读更多精彩内容