2018-05-03 开胃学习Data系列 - Amazon EMR

Amazon EMR 是一个托管集群平台,可简化在 AWS 上运行大数据框架 (如 Apache HadoopApache Spark) 以处理和分析海量数据的操作。借助这些框架和相关的开源项目 (如 Apache Hive 和 Apache Pig)。您可以处理用于分析目的的数据和商业智能工作负载。此外,您可以使用 Amazon EMR 转换大量数据和将大量数据移入和移出其他 AWS 数据存储和数据库,如 Amazon Simple Storage Service (Amazon S3) 和 Amazon DynamoDB。

Amazon 的 Hadoop Solution 是 EMR

HDFS is a distributed, scalable, and portable file system for Hadoop. An advantage of HDFS is data awareness between the Hadoop cluster nodes managing the clusters and the Hadoop cluster nodes managing the individual steps.

目前唯一可以存储 1 petabyte 数据的地方就是 Amazon

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 文/老叟 当城市迷陷于朦胧诗 当六月热河 以一位虔诚者的名义 坠入天边的繁星 我知道 夜已深了 不偏也不倚 不蔓也...
    编辑鹿深阅读 2,394评论 0 1
  • 1、 s小姐是我的小学和初中同学,大概是天生的身体协调性和运动天赋比较好,小学刚入学的时候,她就被体育老师挑进了校...
    自然派妈妈阅读 6,523评论 0 0
  • 快乐书法林昊元 七岁男童林昊元入惠文堂学习书法不到一年,最近又对画画产生兴趣,开始教他玩色彩,涂涂、写写对于他来说...
    吴鸿发阅读 3,783评论 2 1
  • 出于对新(黑)科技的好奇,对于无人驾驶汽车的现状和未来,写了一篇文字,抛砖引玉,和朋友们一起探讨;也要声明,并...
    haijian阅读 3,926评论 0 8