hadoop第一讲

一、 hadoop和hadoop的生态圈

二、 那大数据到底是什么?又为什么要学习它?

GFS --> google file sys
MapReduce
BigTable

解压安装包

配置环境变量

将配置hadoop的安装目录下的

HDFS -》hadoop distrbuted system 易于扩展分布式文件系统

YARN 集群资源统一管理

HDFS

  1. 存储容量大
  2. 自动快速的检测对应硬件错误
  3. 流式反问数据
  4. 移动计算比移动数据更划算
  5. 简单一致性模型
  6. 异构平台可移植

优点
高可靠性
高扩展性
高效性
高容错性

缺点

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容