登录注册写文章

Hadoop学习笔记(2)-HDFS

Hadoop学习笔记(2)-HDFS

自行整理, 学习用途, 侵知删歉

NameNode内存分配

当一个NameNode运行的时候, 所有的metaData都储存在RAM中(快速响应);

item(150 - 200 bytes):
-文件名, 权限等
-每一个block的信息

为什么HDFS适合少却大的文件: 分出来的block比较少, 利于查找读取

HDFS 文件权限

HDFS中的文件有所有者, 组, 权限. [和linux类似]
文件权限

读	写	执行
r	w	x

对于路径, x意味着他的children可以访问
HDFS believes you are who you tell it you are
HDFS的安全性包括授权(authorization), 但是却比较基础, 如果要加强, 可以集成Kerberos

NameNode Web UI

HDFS file shell

HDFS不是一个通用文件系统, 所以需要特殊的软件访问.
客户端用户一般可以用hadoop fs command指令访问HDFS.

显示/user/fred/sales.txt的文件内容

$ hadoop fs -cat /usr/fred/sales.txt

新建一个report路径

$ hadoop fs -mkdir /reports

上传,获取HDFS文件
![]](http://upload-images.jianshu.io/upload_images/2173882-4f1fabedde0fdd7d.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

$ hadoop fs -put sale.txt /reports
$ hadoop fs -get /reports/sales.txt

获得一个HDFS路径下列表

$ hadoop fs -ls /

删除文件

$ hadoop fs -rm /reports/sales.txt

总结

HDFS通过在机器间分布大文件块来支持MapReduce的数据本地化
HDFS通过数据备份来实现容错机制
NameNode守护进程在内存中拥有所有HDFS metadata, 同时也保存在硬盘上

最后编辑于：2017.12.06 02:39:54

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

Hadoop学习笔记（二）HDFS
HDFS的设计目标通过上一篇文章的介绍我们已经了解到HDFS到底是怎样的东西，以及它是怎样通过多副本机制来提供高...
陌上疏影凉阅读 1,529评论 0赞 3
HDFS的使用（随时更新）
首先，我们在使用前先看看HDFS是什麽？这将有助于我们是以后的运维使用和故障排除思路的获得。 HDFS采用mast...
W_Bousquet阅读 4,437评论 0赞 2

Hadoop 2.7.1 搭建
1 目的将hadoop 2.7.1 安装到 166、167、168 三台机器上2 提供环境练习环境192.168....
灼灼2015阅读 3,622评论 4赞 40
每日500字 DAY16 少抱怨，多包容
彼此两个人相处的时间长了，久了，生活总会出现一些小问题。有时真挺羡慕别人家夫妻之间的保鲜度，如何维持的？最近老是...
美燕1Miya阅读 270评论 0赞 0
旅游的第一天
在一天的行程内，我们过的是最棒的一天。我们就去了安徽那里的空气都是潮湿的，简直如大雨刚下的一样，我们刚去那里就上...
放下callmingman阅读 369评论 0赞 1

友情链接更多精彩内容

赞1赞

赞赏

手机看全文