Storm 概念简介

刚刚甩了自己几个大嘴巴子,让自己好好静一静。不多说了,重新整理下Storm的简介。按下自己看啥都难受的心。

一、Apache Storm

为何要学Storm

  1. Storm虽然不是流处理里面最好的(Flink已经青出于蓝而胜于蓝了,还有阿里更胜一筹的Blink),但是绝对是入门的关键。
  2. 明晰自己的目的:低延时、无穷数据、持续计算,这是我们应用流处理的原由。列举一个最最简单的例子:屏蔽词。

支持平台

原先只支持Unix兼容的操作系统上,0.9.1版本后同时兼容Windows

技术栈介绍

Java和Clojure + Python

而因为JNI的原因,其实Storm的组件(spout和bolt)都可以使用其他任意语言进行开发。

环境

Storm开发环境装配详见《原生腾讯云centos7.5 Apache Storm搭建指南
》(备注:为了降低配置环境时,因为权限、目录等影响,游鱼默认用的是root用户,并且关闭了防火墙。但是有关问题还是会提到的,只要注意一下就好了。另外./指的是zookeeper的根目录)

二、理念

基础架构
  • Input data source:数据源
  • Spout:流的源,通过编写Spout以从数据源读取数据
  • Bolt:逻辑处理单元,Spout将数据传到Bolt和Bolt的过程,并产生新的数据流,Bolt可以进行过滤、聚合,并与数据源和数据库进行交互。
  • Tuple:有序元素列表
  • Stream:元组的无序序列

关键词:拓扑和路由

三、集群架构

集群
  • Apache Storm的集群架构采用了主从设备模式。
  • Zookeeper framework:协助Supervisor和nimbus交互
  • Nimbus:Storm集群的主节点,又称Master。而工作节点分发数据并监控故障
  • Supervisor:工作节点又称Workers,负责管理工作进程以完成分配的任务
  • Woker process:工作进程,其执行与特定拓扑相关的任务,其创建执行器,并要求他们完成任务
  • Execute:执行器,由工作进程产生的单个进程,用于特定的spout与bolt
  • Task:任务,实际执行数据处理。他是个spout或bolt

四、工作流程

集群工作流程

五、初步示例

由此鱼这边启动半年前入门的小Topology回味下简介,内容其实就是常见的词频统计。

测试——Storm下一个简单的JAVA实现

#开启Zookeeper 
> ./bin/zkServer.sh start
#在主设备上开启nimbus、ui
> ./bin/storm nimbus &
> ./bin/storm ui &
#在其他设备上开启supervisor
> ./bin/storm supervisor &
#主设备状态
> jps
16290 Jps
1844 nimbus
2020 core
789 QuorumPeerMain
#其他设备状态
> jps
12931 Jps
3349 Supervisor
2079 QuorumPeerMain
#提交Topology
#不知道为什么,这次鱼在主节点上无法启动Supervisor,以后再细看,推测是因为这次只启用了两个节点,配置上起了冲突

此时工作就开始了!最好的办法是进入Storm UI一探究竟。

节点架构

由上至下分别是:

  • Apache Storm总概览
  • 任务分配节点状态
  • 任务状态
  • 任务执行节点状态

然后再进入任务内部,一探究竟

任务简介

由上至下分别是:

  • 任务总概
  • 向任务发出指令
  • 任务一段时间内的状态
  • 流的源
  • 逻辑处理单元

环境搭建

安全生产

对于内部环境来说,做物理隔绝就好,只要将zookeeeper的数据源对外开放就好。当然大致还是说明下安全生产的基本要求:

  1. 为storm创建独有的用户,并且开放用户对配置文件中data文件夹的全权。
  2. 对外开放一下端口(配置文件可以修改,不要照搬):
    • zookeeper:2181,2888,3888
    • storm.supervisor:6700,6701,6702,6703
    • storm.UI:9090
    • storm.nimbus:6627
    • 一些其他常用的网络通讯端口
  3. 因为storm的个个模块是设计成快速启动和结束的,也就是说他不会自我恢复。所以守护进程也是个很重要的手段。

准备工作

Zookeeper集群设置(单例)
Zookeeper集群设置(集群)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,222评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,455评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,720评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,568评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,696评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,879评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,028评论 3 409
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,773评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,220评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,550评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,697评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,360评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,002评论 3 315
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,782评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,010评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,433评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,587评论 2 350

推荐阅读更多精彩内容