HDFS个人学习总结

WHAT

HDFS:分布式文件系统

Feather:
  • 检测和快速自动恢复
  • 支持大文件存储
  • 对文件实行一次写入、多次读取的访问模式
Drawback:
  • 延迟高(对于低延迟的访问需求,可以使用HBase)
  • 无法高效存储大量小文件
  • 不支持修改文件,只能执行追加操作
Structure:
  • NameNode:管理文件系统的命名空间,维护文件系统树、所有文件、目录以及块的元数据,元数据有两种namespace image和edit log。
    namenode拥有block和datanode之间的映射关系,但是它并不持久化这些信息,这些信息来源依赖于datanode启动时向namenode发送的报告。
  • SecondaryNameNode:辅助的NameNode,周期性的将edit log文件合并(HDFS的HA机制)
  • DataNode :datanode维护着最终的block,并定期向namenode发送该datanode包含的block列表(心跳机制)。
HDFS架构

WHERE

整个工作流上的位置

HOW

  • hadoop fs -ls : 查看HDFS下的文件列表
  • hadoop fs -mkdir:创建目录
  • hadoop fs -put:上传文件
  • hadoop fs -get:下载文件到本地
  • hadoop fs -cat:查看文件内容
  • hadoop fs -rm:删除文件
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 首先,我们在使用前先看看HDFS是什麽?这将有助于我们是以后的运维使用和故障排除思路的获得。 HDFS采用mast...
    W_Bousquet阅读 4,228评论 0 2
  • HDFS的设计目标 通过上一篇文章的介绍我们已经了解到HDFS到底是怎样的东西,以及它是怎样通过多副本机制来提供高...
    陌上疏影凉阅读 1,459评论 0 3
  • 题记:正值学校运动会假期,想吸收点新鲜的血液。心血来潮搭了个hadoop的伪分布式,了解了下HDFS。 HDFS简...
    朱晓飞阅读 793评论 0 0
  • 先思考问题 我们处在一个大数据的时代已经是不争的事实,这主要表现在数据源多且大,如互联网数据,人们也认识到数据里往...
    墙角儿的花阅读 7,422评论 0 9
  • 翻译自:原文。 大多数的开发者在使用Gralde时都选择使用Gradle Wrapper。这非常好,因为使用Gra...
    aicaprio阅读 742评论 0 1