1 HDFS

1.家庭成员

家庭成员

2.HDFS概述

1.HDFS结构

Paste_Image.png

元数据就是除了文件数据之外的数据,如文件名。实际上,元数据在磁盘中也有备份,只是启动时加载到内存中。

2.HDFS运行机制

Paste_Image.png

3.HDFS优缺点

  • 优点:
Paste_Image.png
  • 缺点:
Paste_Image.png

小文件越多,则元数据越多,与数量有关,与大小无关。
不能修改。

4.HDFS架构

Paste_Image.png

上图中黑色虚线有问题,应该是client操作datanode。
从图中可以看出:

  • 客户端向namenode请求读写服务。
  • 每个datanode中的存储单元称为“块”,见下图。
Paste_Image.png
  • 每个块都在其他datanode中存有副本。
    下图显示了HDFS的设计思想:
Paste_Image.png

解读:一个文件有50G,假设被分成4个block,则每个block都有3个副本,这3个副本一定要存放在不同的节点上。假如有一个节点坏了,导致block1只有2个副本了,那系统会自动复制一份副本添加到比较空闲的节点上。

3.HDFS三种节点解读

1.NameNode(NN)

Paste_Image.png

edits解读:
如果新增或删除一个文件,edits会记录对metadata的操作日志,但不会马上写入fsimage。每隔一段时间,会把edits与fsimage内容进行合并,这件fsimage中才会记录是新增了还是删除了文件。

2.SecondaryNameNode(SNN,面试会问)

1.意义

Paste_Image.png

因为namenode的主要功能是接收客户端的读写服务,而合并edits会占用大量时间,这时SecondaryNameNode就可以协助namenode合并edits log。

2.合并流程

Paste_Image.png

解读:

  • SecondaryNameNode有可能在另外一个节点上,交付工作可能会跨节点。
  • edits交付到SecondaryNameNode之前,会拷贝一份新edits,来继续它的工作。
  • 在SecondaryNameNode中,edits和fsimage进行合并,完成后传回namenode,成为新的fsimage。
  • SecondaryNameNode能做备份就体现在,它存放着namenode的一份合并之前的edits和fsimage的副本。但没有保存edits.new,也就说当namenode坏了,只能通过SecondaryNameNode找回大部分元数据。
  • 所以尽量把这两种namenode放在不同的节点上。

3.datanode(DN)

1.意义

Paste_Image.png

解读:
是namenode主动向datanode发送心跳。

2.Block副本放置策略

Paste_Image.png

解读:

  • 因为不同机架的电源往往不同,一台机架电源断了,机架内所有节点的文件都丢失。
  • 不同机架,保证安全。
    相同机架,保证速度。

4.HDFS读/写流程(面试会问)

1.读流程

Paste_Image.png

解读:

  • client通过DFS的open方法去请求NameNode,得到block的位置信息
  • 再通过FSDataInputStream流去读每个block的副本中的一个,把这些block还原成文件
  • 关闭流

2.写流程

Paste_Image.png

解读:

  • client用DFS的create方法请求NameNode,NameNode再返回给应该分成多少block、放在哪个DataNode上等信息
  • 通过FSDataOutputStream流去把每个block的一个副本写在DataNode里,DataNode再创建线程把block的副本写到其他datanode里(client和datanode有可能很远,但是datanode间很近,这样是为了保证速度),写完的信息返回给namenode
  • 关闭流

5.HDFS文件权限

Paste_Image.png

解读:
不需要密码认证,不会检查你的身份是不是本人。

6.HDFS安全模式

启动HDFS时,首次进入的模式就是安全模式。尽量不要退出安全模式,会导致数据的丢失。

Paste_Image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,843评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,538评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,187评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,264评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,289评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,231评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,116评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,945评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,367评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,581评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,754评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,458评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,068评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,692评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,842评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,797评论 2 369
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,654评论 2 354

推荐阅读更多精彩内容

  • 自行整理, 学习用途, 侵知删歉 1.HDFS 新加入的文件被分成block, 64M默认; 默认每一个block...
    丸蛋蟹阅读 481评论 0 0
  • 认识HDFS HDFS的特点: 高容错性高吞吐量故障的检测和自动快速恢复流式的数据访问大数据集一次写入,多次读写 ...
    Bloo_m阅读 3,262评论 6 8
  • 思考问题 HDFS的架构 设计前提和目标 专为存储超大文件而设计:hdfs应该能够支持GB级别大小的文件;它应该能...
    Sakura_P阅读 637评论 0 2
  • 我叫零,我已经初三了,刚开学我就要调到另一个学校了,我不知道我妈怎么想的,快毕业了 ,还要转学。 我“哦,这里真不...
    零缘阅读 168评论 0 0
  • 01 你有没有喜欢,或者真正地爱过一个人? 原来喜欢和爱,终是有区别的。写文章的我,经常会捕捉到一些微妙的感情,只...
    跟我看世界阅读 718评论 0 2