[翻译] Storm和Spark Streaming的横向比较

本文翻译自 http://xinhstechblog.blogspot.com/2014/06/storm-vs-spark-streaming-side-by-side.html

另，首先在 http://www.cnblogs.com/hysoka/articles/4097972.html 看到，然而觉得样式不太喜欢以及图片显示不出来，所以重新做了翻译。

内容简介

本文主要讲述storm和spark streaming之间的横向比较，给大家一个直观的感受，以及帮助大家在做流处理时能够选择合适的开源框架。

一、概述

Storm和Spark Streaming是分布式流处理的开源框架。但是，它们之间也有一些重要的差异，在下文中可以看到。

处理模型以及延迟

虽然这两个框架都提供可扩展性和容错能力，但它们在处理模型中有根本的不同。 Storm一次处理一个即将到达的事件，而Spark Streaming会处理在一定的时间内（时间间隔可自己设置）在窗口中收到的一批事件。因此，Storm可以实现处理事件的亚秒级延迟，而Spark Streaming有几秒钟的延迟。

容错和数据保证

二者在容错数据保证上做出了各自的权衡。Spark Streaming在容错方面提供了对状态计算的更好的支持。

在Storm中，每个单独的记录必须在其通过系统时被跟踪，因此Storm仅保证每个记录至少被处理一次，但是从故障中恢复期间允许出现重复。这意味着可变状态可能不正确地更新了两次。

另一方面，Spark Streaming只需要在批处理级别进行跟踪处理，因此即使发生节点故障等故障，也可以有效地保证每个小批量都能够被精确处理一次。 [实际上，Storm的Trident库也提供了精确处理一次机制。但是，它依赖于事务来更新状态，这是更慢的，并且通常是由用户去实现。]

Storm vs. Spark Streaming comparison.

小结

总之，如果你需要亚秒级延迟并且没有数据丢失，Storm是一个不错的选择。如果你需要有状态计算，保证每个事件精确处理一次，Spark Streaming更好。 Spark Streaming编程逻辑也可能更容易，因为它类似于批处理编程，如果您正在使用批处理（尽管是非常小的批次）。

二、实现和程序API

实现

Storm主要使用Clojure中实现，而Spark Streaming使用Scala实现。这是要记住，如果你想去阅读代码来看看系统如何工作的或者自己去定制一些东西，更要牢记它们的编程实现。Storm是由BackType和Twitter联合开发的；Spark Streaming是在加州大学伯克利分校开发的。

程序API

Storm提供一套Java API，同时可以很好的支持其它编程语言。Spark Streaming可以用Scala开发，也支持Java。

批处理框架集成

Spark Streaming有一个好的特性是它运行在Spark上。因此，你可以使用相同(或者非常近似)的代码去实现批处理操作，或者在Spark Streaming上对Spark进行交互式的查询。这减少了编写用于处理流数据和历史数据所需的单独的代码的需求。

Storm vs. Spark Streaming: implementation and programming API.

小结

Spark Streaming的两个优势：

它不是用Clojure实现的(更具通用性)
它可以很好的与Spark批处理计算框架集成

三、产品和支持

产品使用

Storm已经发布几年了，在Twitter上从2011年运行至今，现在也有很多其他公司在使用。相对而言，Spark Streaming是一个新项目，仅在2013在Sharethrough上投入生产使用。

Hadoop分发和支持

Storm(仅支持这一个)是Hortonworks Hadoop data platform数据平台的流式计算解决方案。而Spark Streaming同时支持MapR's distribution和Cloudera's Enterprise data platform两个Hadoop数据平台。另外还有Databricks公司对包含Spark Streaming的Spark stack提供支持。

集群管理集成

两套系统均可以运行在它们自己的集群上，Storm仍然只能运行于Mesos上，Spark Streaming在YARN和Mesos上均可以运行。

Storm vs. Spark Streaming: production and support.

小结

Storm的实际产品应用经验要比Spark Streaming久得多。但是Spark Streaming有两点优势：

作为开源产品有一个重量级公司给予支持和贡献技术力量；
原生适配YARN。

最后编辑于：2017.12.05 02:55:00

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 212,185评论 6赞 493
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,445评论 3赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 157,684评论 0赞 348
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,564评论 1赞 284
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,681评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,874评论 1赞 290
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,025评论 3赞 408
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,761评论 0赞 268
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,217评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,545评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,694评论 1赞 341
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,351评论 4赞 332
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,988评论 3赞 315
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,778评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,007评论 1赞 266
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,427评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,580评论 2赞 349