Hadoop学习笔记(2)-HDFS

自行整理, 学习用途, 侵知删歉

NameNode内存分配

当一个NameNode运行的时候, 所有的metaData都储存在RAM中(快速响应);

item(150 - 200 bytes):
-文件名, 权限等
-每一个block的信息

为什么HDFS适合少却大的文件: 分出来的block比较少, 利于查找读取

HDFS 文件权限

HDFS中的文件有所有者, 组, 权限. [和linux类似]
文件权限

执行
r w x

对于路径, x意味着他的children可以访问
HDFS believes you are who you tell it you are
HDFS的安全性包括授权(authorization), 但是却比较基础, 如果要加强, 可以集成Kerberos

NameNode Web UI

HDFS file shell

HDFS不是一个通用文件系统, 所以需要特殊的软件访问.
客户端用户一般可以用hadoop fs command指令访问HDFS.

  • 显示/user/fred/sales.txt的文件内容
$ hadoop fs -cat /usr/fred/sales.txt
  • 新建一个report路径
$ hadoop fs -mkdir /reports
$ hadoop fs -put sale.txt /reports
$ hadoop fs -get /reports/sales.txt
  • 获得一个HDFS路径下列表
$ hadoop fs -ls /
  • 删除文件
$ hadoop fs -rm /reports/sales.txt

总结

  • HDFS通过在机器间分布大文件块来支持MapReduce的数据本地化
  • HDFS通过数据备份来实现容错机制
  • NameNode守护进程在内存中拥有所有HDFS metadata, 同时也保存在硬盘上
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • HDFS的设计目标 通过上一篇文章的介绍我们已经了解到HDFS到底是怎样的东西,以及它是怎样通过多副本机制来提供高...
    陌上疏影凉阅读 5,302评论 0 3
  • 首先,我们在使用前先看看HDFS是什麽?这将有助于我们是以后的运维使用和故障排除思路的获得。 HDFS采用mast...
    W_Bousquet阅读 9,751评论 0 2
  • 1 目的将hadoop 2.7.1 安装到 166、167、168 三台机器上2 提供环境练习环境192.168....
    灼灼2015阅读 8,836评论 4 40
  • 彼此两个人相处的时间长了,久了,生活总会出现一些小问题。有时真挺羡慕别人家夫妻之间的保鲜度,如何维持的? 最近老是...
    美燕1Miya阅读 1,631评论 0 0
  • 在一天的行程内,我们过的是最棒的一天。 我们就去了安徽那里的空气都是潮湿的,简直如大雨刚下的一样,我们刚去那里就上...
    放下callmingman阅读 2,563评论 0 1