登录注册写文章

hadoop_hdfs：namenode和datanode

hadoop_hdfs：namenode和datanode

NameNode 概述
a、 NameNode 是 HDFS 的核心。
b、 NameNode 也称为 Master。
c、 NameNode 仅存储 HDFS 的元数据：文件系统中所有文件的目录树，并跟踪整
个集群中的文件。
d、 NameNode 不存储实际数据或数据集。数据本身实际存储在 DataNodes 中。
e、 NameNode 知道 HDFS 中任何给定文件的块列表及其位置。使用此信息
NameNode 知道如何从块中构建文件。
f、 NameNode 并不持久化存储每个文件中各个块所在的 DataNode 的位置信息，
这些信息会在系统启动时从数据节点重建。

namenode存储在机器的内存当中，在namenode所在的机器因为各种原因关闭重启后，所有的datanode会向namenode报告自己的存储信息。namenode接收重新存储在内存当中
g、 NameNode 对于 HDFS 至关重要，当 NameNode 关闭时，HDFS / Hadoop 集群无
法访问。
h、 NameNode 是 Hadoop 集群中的单点故障。
i、 NameNode 所在机器通常会配置有大量内存（RAM）

DataNode的概述

DataNode负责将实际数据存储在HDFS中。
DataNode也称为Slave。
NameNode和DataNode会保持不断通信。
DataNode启动时，它将自己发布到NameNode并汇报自己负责持有的块列表。
当某个DataNode关闭时，它不会影响数据或群集的可用性。NameNode将安排由其他DataNode管理的块进行副本复制。
DataNode所在机器通常配置有大量的硬盘空间。因为实际数据存储在DataNode中。
DataNode会定期（dfs.heartbeat.interval配置项配置，默认是3秒）向NameNode发送心跳，如果NameNode长时间没有接受到DataNode发送的心跳， NameNode就会认为该DataNode失效。
block汇报时间间隔取参数dfs.blockreport.intervalMsec,参数未配置的话默认为6小时.
参考自:https://blog.csdn.net/weixin_39228808/article/details/84898322

最后编辑于：2023.05.22 10:09:55

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

hadoop中NameNode、DataNode、Secondary、NameNode、Job...
1.job的本质是什么？ 2.任务的本质是什么？ 3.文件系统的Namespace由谁来管理，Namespace的...
云中捞月阅读 5,430评论 0赞 3
Hadoop NameNode 高可用 (High Availability) 实现解析
转至：https://www.ibm.com/developerworks/cn/opensource/os-cn...
AlexYao阅读 5,346评论 0赞 1
Hadoop Namenode/Datanode节点丢失
环境 CentOS 6.8 64位 1核 2GB JDK 1.7.0_55 64 位 Hadoop 1.1.2 问...
Yohann丶blog阅读 3,803评论 0赞 0
Hadoop--DataNode工作机制
DataNode工作机制 1）一个数据块在datanode上以文件形式存储在磁盘上，包括两个文件，一个是数据本身，...
李小李的路阅读 3,795评论 0赞 1
数据库‖超万亿规模的Hadoop NameNode性能故障排查过程分享
作者介绍母延年，大数据领域数据分析处理专家，原腾讯和阿里巴巴大数据领域专家级工程师。曾在阿里开源项目Mdrill...
录信数软阅读 4,930评论 0赞 2

赞1赞

赞赏

手机看全文