storm topology生命周期

转述自:Lifecycle of a Storm Topology

本文介绍的storm topology生命周期是基于0.7.1版本的,之后版本可能已发生了一些变化

我们从执行storm jar命令提交topology给nimbus开始,到supervisor启动或停止worker,再到task执行整个过程进行描述,这其中也包括nimbus是如何监控topology的。

关于topology的两点说明:

1. 实际运行中的topology与我们看到的是不同的。运行过程中会有stream和acker bolt加入进来以保证数据处理的可靠性,system-topology函数负责topology的创建

2.system-topology用在a. nimbus创建task时 b.worker route消息时

启动topology


storm jar命令会设置storm.jar环境变量在StormSubmitter上传jar时使用,�然后带着命令行参数执行指定的class。StormSubmitter.submitTopology按以下步骤执行:

    *  upload未上传过的jar文件

    * 使用nimbus的thrift接口实现uploading jars

    * uploadChunk每次上传15kb的数据

    * 上传完毕时调用finishFileUpload

    * topology的配置用json格式序列化


nimbus接收topology提交的请求,并对每个topology的配置进行规范格式化,完成topology一些静态属性的设置:

    * jars和configs存放在本地文件系统中,具体为:{nimbus local dir}/stormdist/{topology id}

    * setup-storm-static 将task--->component的映射写入zookeeper

    * setup-heartbeats在zk中创建一个目录来存放task心跳


nimbus调用mk-assignment给各个节点机分配任务,使用到以下信息:

    * master-code-dir:  supervisors用来下载jars/configs

    * task->node+port: 任务id到worker的映射关系,worker由(node,port)对来标识

    * node->host: node id到hostname的映射关系。workers用这个映射关系来与其他worker进行通信,node id用来标识supervisors,因为多个supervisors可以运行在同一台机器上

    * task->start-time-secs: 任务启动的时间戳,nimbus用来监控topology,launch time out需要设置的比心跳超时时间大一些,因为启动时有很多初始任务要做,由nimbus.task.launch.secs设定

任务分配完处于deactivated模式,start-storm将相关数据写到zk之后进入active模式spouts开始emit tuples


supervisor默默的做两件事:

    * 调用synchronize-supervisor,zk任务分配变化时就会执行,另外每10s也会定时执行,执行时下载新的topology jars,将node要执行的任务写到本地文件系统,其实是一个映射关系 port->localAssignment, LocalAssignment包含一个topo id还有task ids

    * 调用sync-processes,  读取第一件事写到本地文件的内容并与运行的topology对比以决定启停worker

mk-worker函数用来启动worker

    * worker之间互连并启动一个线程监控变化,如果worker任务变更会与启停worker重连

    * 监控topology是否active并将这个状态赋给storm-active-atom变量,task根据这个变量决定是否调用spouts的nextTuple

    * worker启动线程来执行具体的tasks

mk-task函数用来启动task

    * task启动一个routing函数,接收stream输出tuple返回task ids(用来发送tuple)

    * task执行spout和bolt业务逻辑


Topology监控

nimbus对topology的整个生命周期进行监控

    * 定时线程执行日常任务的检查

    * nimbus按一个有限状态机转动,包含:active\inactive\killed\rebalancing五个状态

    * nimbus.monitor.freq.secs设定检测周期,调用reassign-topology触发monitor事件完成

    * reassign-topology调用mk-assignments来执行topology的更新,更新时会启停workers


杀掉Topology

storm kill调用nimbus thrift接口完成这个任务,可以用-w 指定remove topology的timeout,

也给workers时机来处理完正在执行的指令。kill命令是fault-tolerant的,当nimbus恢复时会remove killed状态的topology,之后删除zk中该topology的信息和心跳目录\jars\configs,这个由单独的线程do-cleanup 完成

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,186评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,858评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,620评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,888评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,009评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,149评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,204评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,956评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,385评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,698评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,863评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,544评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,185评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,899评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,141评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,684评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,750评论 2 351

推荐阅读更多精彩内容

  • 目录 场景假设 调优步骤和方法 Storm 的部分特性 Storm 并行度 Storm 消息机制 Storm UI...
    mtide阅读 17,092评论 30 60
  • 1. Storm介绍: Storm是实时流计算框架。企业中典型实时分析框架搭建模式: Flume + Kafka ...
    奉先阅读 1,652评论 0 3
  • Strom集群结构是有一个主节点(nimbus)和多个工作节点(supervisor)组成的主从结构,主节点通过配...
    看山远兮阅读 2,841评论 0 7
  • Date: Nov 17-24, 2017 1. 目的 积累Storm为主的流式大数据处理平台对实时数据处理的相关...
    一只很努力爬树的猫阅读 2,165评论 0 4
  • 第一百零三章 别了,兰州。 来了,东莞。 文雍选择在除夕那天出发,听说那天的列车是最宽松的,走之前他把商校杜大姐那...
    何来雍雅阅读 249评论 1 4