HDFS 分布式文件存储服务(二) 原理介绍

SPOF

  • spof: single point of failure 即单点故障
    任何只有一个节点的服务都会存在该问题

HDFS 写数据流程

1 client请求NN是否可以上传数据,nn根据请求校验集群信息及元数据信息,返回是否可以上传

  1. client根据Configuration配置信息,将文件切分,并向nn请求上传block1,
  2. nn根据请求计算各个dn距离client的网络距离和各个dn的状态(健康状态,活跃性,节点存储能力等),返回给最合适的dn列表给client
    机架感知策略:
    网络拓扑距离:
  3. client根据返回的dn列表,选择网络距离最近的dn建立pipeline输送管道 开始进行block的上传,上传方式为将block拆分为每个64k大小的package数据包进行发送,等待ack返回确认
  4. dn接收且保存下client发送的package数据包,并与下一个dn建立pipeline,将此数据包继续发送到下一个dn,下一个dn重复此动作,直到备份的dn全部接收完成,然后顺序返回ack确认
    数据包带着各备份datanode的信息
  5. client接收到ack确认之后,继续上传下一个package,直到block1上传完毕
  6. client重复第二步开始进行下一个block的上传,直到文件上传完毕
  7. 整个文件上传完成后,client提交上传结果给nn,nn记录元数据信息

HDFS 读数据流程

  1. client请求NN下载数据,nn根据请求信息判断集群信息及元数据信息,返回该文件的元数据所有数据块地址列表
  2. client在一个数据块请求中启动多个线程 并发的进行数据块的read操作
  3. 将读到的文件写入本地的临时文件中
  4. client继续请求下一个数据块,重复第二步,知道文件块全部下载完成
  5. client处理合并本地临时文件成为一个整体文件

数据安全策略

  • 元数据安全: secondarynamenode或standby 将内存中或edits文件中的数据同步到fsimage文件中
  • 节点数据安全: 副本机制
  • linux文件系统安全: 磁盘冗余阵列 raid

元数据管理

元数据类型:

  • 命名空间的目录树结构
  • 文件和数据块位置信息
  • 从节点状态数据(健康,磁盘使用情况)

存储介质:

  • 内存:内存元数据
  • 磁盘:编辑日志edits和镜像文件fsimage

备份机制 checkpoint:

  • 非高可用:由secondarynamenode定期(默认1小时,100万条record)执行checkpoint。新生成一个edits文件继续记录元数据变化,将原有的edits与fsimage复制后合并,生成新的fsimages文件,然后复制发送给namenode;
  • 高可用:namenode将生成的编辑日志转储到journalnode集群上,再由备份节点的namenode将执行日志载入到自己的内存中,并生成新的fsimage

查看元数据:

  • 查看镜像文件,oiv命令;查看编辑日志,oev命令

Federation 联盟机制

  • 场景: 集群中所有的从节点都可以扩展,但是主节点却难以扩展,联邦机制即可以用来实现主节点的扩展
  • 概念:hadoop 2.X 新增机制,两个活跃的namenode公享一个集群从节点进行负载均衡一起工作
  • 特点:联盟机制不能与HA机制共存,如果非要共存,构建多个nameservice(即每个namenode维护自己的nameservice)
  • 区分:通过/nameservice/clusterID/blockPoolID区分从节点上的某个块属于哪个集群

容灾机制与负载均衡

  • 容灾机制: 故障转移 主备机制 HA高可用
  • 负载均衡: 避免热点问题 默认10%的差异值:
  • 均衡策略: 轮询策略,权重策略,随机策略

Safemode 安全模式

  • 概念:
    hdfs集群的一种状态,防止数据块丢失的一种保护机制;
  • 何时会发生:
    1. 集群启动时会进入安全模式,此时nn等待所有dn的汇报,与元数据进行比较,来校验数据是否丢失及恢复
    2. 当发现数据丢失时,当前所有存在的块/元数据中记录的块 <= 99.9%,会停留在安全模式,实现数据恢复, 直到大于99.9%,会自动退出
    3. 手动进入,用于hdfs集群的升级和维护
  • 安全模式的特征:
    1. 安全模式下 不允许写入,只允许读,可以通过客户端强制离开安全模式

集群的动态扩容和缩容

  • 动态扩容
    增加从节点,可加入白名单,然后启动该节点,启动负载均衡
  • 动态缩容
    下线从节点,需要加入黑名单,然后刷新节点信息,启动负载均衡

脑裂现象

  • 概念:网络或节点信息不可靠造成的误报信息,导致产生集群无主或集群多主的现象

隔离机制

  • 概念:为了避免脑裂机制的产生,需要设置namenode的隔离机制,即当备份节点需要转换为主节点时,会通过ssh免密登录到上个active节点上,杀死或许存在的namenode进程;

HA高可用

  • 概念:通过备份名称节点,达到避免namenode节点单点故障的问题;
  • 实现:
    如何通过主备切换: 利用zk的分布式锁,通知机制,节点类型和hadoop的zkfc进程
    如何进行数据同步: 利用journalnode编辑日志edits文件共享集群

相关端口

8020 hdfs节点通讯端口
50070 hdfs页面访问端口
8485 journalnode通讯端口

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,192评论 6 511
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,858评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,517评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,148评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,162评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,905评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,537评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,439评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,956评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,083评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,218评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,899评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,565评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,093评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,201评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,539评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,215评论 2 358

推荐阅读更多精彩内容

  • 夜莺2517阅读 127,720评论 1 9
  • 版本:ios 1.2.1 亮点: 1.app角标可以实时更新天气温度或选择空气质量,建议处女座就不要选了,不然老想...
    我就是沉沉阅读 6,898评论 1 6
  • 我是黑夜里大雨纷飞的人啊 1 “又到一年六月,有人笑有人哭,有人欢乐有人忧愁,有人惊喜有人失落,有的觉得收获满满有...
    陌忘宇阅读 8,538评论 28 53
  • 兔子虽然是枚小硕 但学校的硕士四人寝不够 就被分到了博士楼里 两人一间 在学校的最西边 靠山 兔子的室友身体不好 ...
    待业的兔子阅读 2,605评论 2 9