(01)Spark学习——四大特性

Apache Spark is a fast and general engine for large-scale data processing.

1、Speed 高运行速度

    Run programs up to 100x faster than Hadoop MapReduce in memory,or 10x faster on disk.


2、Ease of use 易用性

    Spark offers over 80 high-level operators that make it easy to build parallel apps. And you can use it interactively from the Scala and Python shells.

3、Generality 一栈式,通用性

    Spark powers a stack of high-level tools including Spark SQL,MLlib for machine learning, GraphX, and Spark Streaming. You can combine these libraries seamlessly in the same application.


4、Runs Everywhere 各处运行

    Spark runs on Hadoop, Mesos, standalone, or in the cloud. It can access diverse data sources including HDFS, Cassandra, HBase, S3.


©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • rljs by sennchi Timeline of History Part One The Cognitiv...
    sennchi阅读 12,159评论 0 10
  • 什么是能所双亡? 就是你做的与结果没有什么关系,你的行动、结果及这个过程都是幻象,幻象世界里没有因果关系,就和做梦...
    悦如水阅读 7,785评论 0 1
  • 股市在年关将近的时候会一直牛下去吗? 紫落凝烟 大盘从10月19号跌到2449后强势反弹,有人说是政策底,也有人说...
    紫落凝烟阅读 1,209评论 0 1
  • 星期六的晚上,妈妈从阿姨家抱回来了一只非常可爱的小狗,我给它起名叫点点。 点点有一身咖啡色的卷毛,头上长着两只小耳...
    陈蓉雪181阅读 1,287评论 0 6