HDFS-分布式文件系统

前言

在大数据场景中，大量数据是以文件形式储存的，典型的是行为日志数据（用户搜索日志，购买日志，点击日志，以及机器操作数据等）
这些数据都很重要，则就必须满足可扩展，容错，易用等特点

背景

HDFS的出现主要解决一下问题：

容错性
数据越来越大，所以储存的服务器就会原来越多，这就要求当中一台服务器异常不影响数据
统一格式储存
数据的大小各不相同，这就要求数据的保存要从新定义，（block 块是一个很好的解决问题）
一次写入多次读取
有些数据（日志）只会写一次，多次读取

分布式系统的存储种类

文件级别的分布式系统
存储单位是文件
块级别的分布式系统
存储单位是将文件分为的等大小的块

HDFS的基本架构

hdfs 采用主从架构（master-slave）

NameNode(主节点)

hdfs的集群管理者，负责管理集群的元信息(维护整个文件的目录结构树和数据块信息)和管理datanode（通过心跳周期性的检测DataNode的存活状态
NameNode的相关问题
1、单点故障：
一个集群只有一个NameNode为之服务，称为“active NameNode”,为了避免单点故障，可备用一台备用机“standby NameNode”;
2、主备切换：
手动模式：通过命令
自动模式：借助zookeeper
3、状态同步：
借助第三方日志储存系统，activeNameNode将操作日志写入共享系统，standby NameNode从共享系统中读取出来
拓展
当数据越来越大时，单个nameNode会成为数据传输的瓶颈，这是就需要对NameNode进行分片，也就是可以允许多个NameNode 对集群进行服务（当然，也得考虑单点故障）

SecondNameNode(检查点节点)

首先，它定时到NameNode去获取edit logs，并更新到fsimage上。
一旦它有了新的fsimage文件，它将其拷贝回NameNode中。
NameNode在下次重启时会使用这个新的fsimage文件，从而减少重启的时间。

DataNode(从节点)

储存实际的数据块，通过心跳即时汇报自己的状态信息

Client(客户端)

用户借助client来与nameNode 和 dataNode 进行交互，完成各种操作
client 完成数据的分块
client 向dataNode传输数据是流水线操作

Hdfs的容错

NameNode 异常
前面已经提到了nameNode 可设置主从配置
DataNode　服务器异常
Hdfs的数据默认是3副本，当发现有数据异常，nameNode 可从新分配
数据块损坏
NataNode在存储数据的时候，会相应的生成一段随机数，当读取的时候发现随机数不一致，就认为数据失效了

HDFS的副本放置策略

客户端与Datanode 同节点（第一个副本写在同节点的datanode上，另外两个副本写在另一个相同机架的不同dataNode上）
客户端与NameNode 与dataNode 不同节点，（第一个副本会随机写在一个nataNode上，另外两个写在另一个相同机架的不同节点上）

HDFS的异构存储介质

hdfs 可支持多种储存介质（固态硬盘，内存等）

集中式缓存管理

HDFS可通过命令或者api来管理集中式缓存系统中的文件和目录，来提高效率

访问方式

shell
api

最后编辑于：2018.09.30 15:42:25

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,734评论 6赞 505
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,931评论 3赞 394
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,133评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,532评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,585评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,462评论 1赞 302
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,262评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,153评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,587评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,792评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,919评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,635评论 5赞 345
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,237评论 3赞 329
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,855评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,983评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,048评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,864评论 2赞 354

HDFS-分布式文件系统

前言

背景

分布式系统的存储种类

HDFS的基本架构

NameNode(主节点)

SecondNameNode(检查点节点)

DataNode(从节点)

Client(客户端)

Hdfs的容错

HDFS的副本放置策略

HDFS的异构存储介质

集中式缓存管理

访问方式

推荐阅读更多精彩内容