增加协调部门:协同部门可以实时收集各个仓库的运作情况,并决策将进货存放在哪里更为合适。
命名节点(Name Node)
在HDFS中,扮演这个角色的节点称为命名节点(Name Node),它维护着系统中的大量元数据,负责管理文件系统的命名空间(Name Space)和控制外部的访问,包括打开、关闭、重命名文件或目录,将数据块映射到具体的数据节点等。
次要命名节点(Secondary Name Node)。
随着协同部门职能重要性的日益增加,总公司可能还会将其管理内容进行备份,这就是次要命名节点(Secondary Name Node)。
次要命名节点和命名节点的区别在于,它不会与数据节点和其他任务节点沟通,也不接收HDFS上的任何变化记录。次要命名节点最主要的目标就是与命名节点通信,根据配置定期地获取命名节点上的HDFS元数据快照,因此效率是非常高的。
数据节点 (Data Node)
在多个仓库中进行备货:意外总是会发生,为了防止意外导致缺货的情况发生,可以采用的一项策略是将货物存储在多地的仓库中。在HDFS中也有同样的理念,这就是备份或副本(Replication)。存储在数据节点上的数据库可以有多个副本,并分发到其他节点上。这样在某个数据节点上丢失的数据,可以在其他数据节点上找到并恢复。容错性得以提升。通过这个案例的比喻,也可以很容易地理解HDFS分布式文件系统一个重要的运用场景,就是与第2章中介绍的数据收集相互集成,保存互联网和大型企业内部每天产生的海量数据内容。理解了这些基本的概念,我们就可以画出图3-2来展示HDFS的工作原理了。
image.png