HDFS Architecture 翻译和理解

HDFS官方文档链接

  1. 硬件故障的容错,在软件层面cover硬件故障。
  2. 流式数据读取,数据的访问是顺序的,对数据跳转访问支持不友好。
  3. 数据集巨大,以TB为单位。
  4. 数据一致性模型:写仅支持append和truncate,不支持update。
  5. hdfs使用时,倾向于在靠近hdfs的集群创建application,原因是hdfs数据量巨大,数据的传输成本高。
  6. NameNode采用master/slave机制,避免数据丢失。
  7. DataNode中,同一个文件会有多个副本(可配置)。面临的问题是:副本在同机房时如果机房发生意外,数据会丢失。副本不在同一机房时,写数据会高度依赖机房间的带宽。针对3个副本的优化是,2个副本在同一个机房的不同DataNode上,1个副本在不同机房的DataNode上。
  8. 数据读取优化,选择离application最近的机房读取副本数据。
  9. NameNode的safemode:Namenode启动时进入safemode,对每个DataNode通过BlockReport获取其存储的数据块的信息,对所有数据块的副本数进行比较,如果副本数小于指定的百分比,那么先进行数据库的复制,直到所有数据块的副本数都满足配置的百分比,退出safemode,开始提供服务。
  10. NameNode中MetaData的持久化。EditLog存储每一个客户端发送的修改,FsImage存储NameNode内存中的全量数据。重启或者达到触发条件时,NameNode会从磁盘中加载FsImage和EditLog,更新内存中的数据并生成新的FsImage和清空旧的EditLog。触发条件通常是时间间隔或累计修改记录数量。PS:对应redis的RDB+AOF。Q:触发数据合并时,如何处理新的写入请求?保留旧的FsImage和EditeLog,fork新进程来创建FsImage,对于新的写入请求,写入旧的EditLog的同时也写入新创建的EditLog,如果新的FsImage未创建完成就宕机,那么从旧的FsImage和EditLog中恢复数据。如果FsImage创建成功,删除旧的FsImage和EditLog。
  11. NameNode只接受客户端和DataNode的RPC请求,不主动推送任何请求。
  12. NameNode通过HeartBeat来确定DataNode是否有效,通常间隔是10min,当DataNode被判定无效时,DataNode将不会被分配读写并会、触发其上面DataBlock的复制,确保每个DataBlock的副本数达到最低限度。这也是为什么心跳间隔时间不能太短,太短容易触发大规模的副本复制。
  13. 集群的负载均衡?集群中的DataNode检测到磁盘容量低于阈值时,将其上面的DataBlock拷贝到别的DataNode中。
  14. DataBlock的数据一致性,client写数据同时会针对每个DataBlock计算checksum并存储到NameNode中,读数据时校验checksum,如果不同则说明数据异常。
  15. MetaData数据的一致性,同时写多个FsImage和EditLog?有用吗?
  16. DataBlock数据的写?一、client向NameNode发送写请求,NameNode回复可写的DataNodeList。二、client向第一个DataNode写数据并告知DataNodeList信息。三、第一个DataNode写数据并且告知下一个DataNode写数据和DataNodeList。
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容