Data Algorithm

MapReduce

Map-Reduce
  • MapReduce is a framework to develop distrubuted applications using Java,Scala, and other programming languages.
  • MapReduces's distributed filesystem is not a replacement for a relational database management systen.

Hadoop and Spark

Hadoop and Spark are two different distributed software frameworks.

  • A spark job can be an arbitrary DAG(Directed Acyclic Graph) of map and/or reduce/shuffle phase. Spark may run with/without Hadoop.

Benefits for big data processing

  • reliability
  • scalability
  • distributed processing
  • parallelism

Chapter 10: Content-Based Recommendation:Movies

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 1.简介 FMDB 是一款简单,易用的封装库。它是对libsalite3框架的封装。 2.优点 1.对多线程的并发...
    修炼一颗真心阅读 2,890评论 1 2
  • 樺小姐。 你还好吗? 樺小姐。 我们从什么时候相识,因为什么而彻夜畅谈,你可记得吗? 你说我是最懂你的人,你又何尝...
    TinYeah阅读 606评论 0 0
  • 文/添一抹岚 每每小孩身体不适,带去看医生。诊断完,开过药,医生总不忘吩咐一声:这几天煲白粥吃,油免去,洒点盐就好...
    添一抹岚阅读 948评论 36 26