Hadoop hdfs

增加协调部门：协同部门可以实时收集各个仓库的运作情况，并决策将进货存放在哪里更为合适。

命名节点（Name Node）

在HDFS中，扮演这个角色的节点称为命名节点（Name Node），它维护着系统中的大量元数据，负责管理文件系统的命名空间（Name Space）和控制外部的访问，包括打开、关闭、重命名文件或目录，将数据块映射到具体的数据节点等。

次要命名节点（Secondary Name Node）。

随着协同部门职能重要性的日益增加，总公司可能还会将其管理内容进行备份，这就是次要命名节点（Secondary Name Node）。

次要命名节点和命名节点的区别在于，它不会与数据节点和其他任务节点沟通，也不接收HDFS上的任何变化记录。次要命名节点最主要的目标就是与命名节点通信，根据配置定期地获取命名节点上的HDFS元数据快照，因此效率是非常高的。

数据节点 (Data Node)

在多个仓库中进行备货：意外总是会发生，为了防止意外导致缺货的情况发生，可以采用的一项策略是将货物存储在多地的仓库中。在HDFS中也有同样的理念，这就是备份或副本（Replication）。存储在数据节点上的数据库可以有多个副本，并分发到其他节点上。这样在某个数据节点上丢失的数据，可以在其他数据节点上找到并恢复。容错性得以提升。通过这个案例的比喻，也可以很容易地理解HDFS分布式文件系统一个重要的运用场景，就是与第2章中介绍的数据收集相互集成，保存互联网和大型企业内部每天产生的海量数据内容。理解了这些基本的概念，我们就可以画出图3-2来展示HDFS的工作原理了。

image.png