HDFS学习

一、特点

1、专为存储超大文件而设计。
2、重点保证高吞吐量而不是低延迟的用户响应。
3、容错性高，有完善的冗余备份机制。
4、支持简单的一致性模型，移动计算优于移动数据，兼容性强。
5、不适用于大量小文件、低延迟数据访问、多用户写入场景。

二、主要组件

HDFS 主要由三个组件构成：
1、NameNode：部署在 Master 节点上。
2、SecondaryNameNode：部署在 Master 节点上。
3、DataNode：部署在 Slave 节点上。

三、数据块

HDFS中的数据块存储在 DataNode 中，以多个副本的形式分布在集群中，默认副本数是3个。
采用数据块存储的好处：
1、文件可以任意大小，不用担心单节点磁盘容量不足。
2、简化了文件子系统的设计，元数据交给主节点管理。
3、有利于提高系统可用性，有利于负载均衡。

四、NameNode

1、元数据

NameNode 管理文件系统的命名空间，维护文件系统树，以及树中的文件的和目录，也负责维护所有文件或目录的打开、关闭、移动、重命名等操作。
具体文件数据传输不需要经过 NameNode。
NameNode 的元数据不包括每个数据块的具体位置信息，因为系统重启时会重构。

2、持久化

将数据写入本地文件系统的同时，再实时同步到一个远程挂载的网络文件系统（NFS）。
运用 SecondaryNameNode 合并的命名空间镜像副本恢复。

五、DataNode

负责存储数据块。
负责为客户段提供数据块读写服务。
根据NameNode的指示进行创建、删除、复制等操作。
通过心跳消息（默认3秒）定期向 NameNode 发送数据块列表信息。

六、SecondaryNameNode

NameNode 中存放元数据的文件是 fsimage。
元数据的操作信息会被持久化到 edits 文件中。
SecondaryNameNode 会定期向 NameNode 请求并合并 fsimage 和 edits 文件，生成新的 fsimage 文件。
NameNode 获取新的 fsimage 文件替换原来的，然后将最后一次检查点的时间戳更新进文件 fstime 中。
SecondaryNameNode 保存状态总是滞后于 NameNode，所以用这种方法恢复数据，难免会有数据丢失。

七、数据备份

在不同节点备份3个副本，选择副本时，HDFS 会请求最近的副本。

八、通信协议

HDFS 的通信协议都是基于 TCP/IP 的。

九、可靠性保证

HDFS 可以检查到数据块损坏。在读取数据块时，HDFS 会对数据块、保存的校验和文件进行匹配检测。如果发现不匹配，NameNode 会重新备份损坏的数据块。

十、基本命令

创建目录

hadoop fs -mkdir /test

hadoop fs -mkdir /test/input

注意，如果没有提前创建好 /test 目录，不能用上述命令创建 input 目录。

查看文件列表

hadoop fs -ls [HDFS路径]

文件上传

将文件从本地复制到HDFS的操作。

hadoop fs -put [本地路径] [HDFS路径]

hadoop fs -copyFromLocal [本地路径] [HDFS路径]

文件下载

将文件从HDFS复制到本地的操作。

hadoop fs -get [HDFS路径] [本地路径]

hadoop fs -copyToLocal [HDFS路径] [本地路径]

查看HDFS中的文件内容

hadoop fs -cat [HDFS路径]

删除HDFS中的文件

hadoop fs -rm [HDFS路径]

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 214,588评论 6赞 496
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 91,456评论 3赞 389
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 160,146评论 0赞 350
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 57,387评论 1赞 288
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 66,481评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 50,510评论 1赞 293
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,522评论 3赞 414
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,296评论 0赞 270
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,745评论 1赞 307
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,039评论 2赞 330
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,202评论 1赞 343
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,901评论 5赞 338
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,538评论 3赞 322
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,165评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,415评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,081评论 2赞 365
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,085评论 2赞 352