登录注册写文章

Spark及其生态圈概述

Spark及其生态圈概述

MapReduce的局限性：

1）代码繁琐；

2）只能够支持map和reduce方法；

3）执行效率低下；

4）不适合迭代多次、交互式、流式的处理；

框架多样化：

1）批处理（离线）：MapReduce、Hive、Pig

2）流式处理（实时）： Storm、JStorm

3）交互式计算：Impala

学习、运维成本无形中都提高了很多

===> Spark

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

BDAS:Berkeley Data Analytics Stack

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

读完这100篇论文就能成大数据高手
作者：Anil Madan 译者：张玉宏文源：LinkeDin 转自：CSDN PayPal高级工程总监Anil...
玫瑰小鹿angelina阅读 13,987评论 0赞 48
一共81个，开源大数据处理工具汇总（上）
本文一共分为上下两部分。我们将针对大数据开源工具不同的用处来进行分类，并且附上了官网和部分下载链接，希望能给做大数...
零一间阅读 5,313评论 0赞 7

Spark 简介笔记整理
1 Spark设计目的设计的目的就是能快速处理多种场景下的大数据问题，能高效挖掘大数据中的价值，从而为业务发展提...
小小少年Boy阅读 4,565评论 0赞 5
Spark生态圈概述与Hadoop对比
Spark：快速的通用的分布式计算框架概述和特点： 1)Speed,（开发和执行）速度快。基于内存的计算；DAG...
鏡澤阅读 4,897评论 0赞 1
史上最全，100+大数据开源处理工具汇总
http://geek.csdn.net/news/detail/210469http://www.36dsj.c...
Albert陈凯阅读 10,798评论 1赞 21

赞1赞

赞赏

手机看全文