大数据组件中,Yarn是一个分布式管理系统,Zookeeper也是一个分布式管理系统,Yarn和Zookeeper的区别和联系是什么?
Yarn是一个分布式资源调度器组件。这个组件的主要作用是在每次接收到请求后,会查看当下的各个子节点的状况,统筹出运算资源的调度方案来保证任务可以顺利执行。通常来说,Yarn所调度的资源常常包括磁盘空间的资源,内存的资源和通讯带宽的资源等。Yarn是Hadoop V2.0开始引入的一个组件,这个组件是针对Hadoop1.0系统所爆露出的计算资源使用不合理等设计上的问题进行的修正和补充。
ZooKeeper是一个分布式一致性服务组件。分布式系统最大的困难之处在于如何保证系统内各个节点服务器所操作或处理的数据是一致的,或者各自的配置信息是相同的,而ZooKeeper的价值就在于实现了基于分布式的统一化配置管理,命名服务,状态同步等。在ZooKeeper的体系下,会使用一种树状的文件存储系统,这一套系统强调在各个子节点下的文件目录结构,文件名称以及文件内容都是相同的,而ZooKeeper会通过其内部机制,保证在发送增删改等操作时,各个子节点会同步操作。
简言之,Yarn和ZooKeeper的区别,Yarn的核心功能在于资源调度与管理,而ZooKeeper的核心功能在于分布式系统中的一致性服务。
参考:
(1)三分钟入门大数据之ZooKeeper和Yarn之间的区别与联系是什么?
https://baijiahao.baidu.com/s?id=1646782229810245424&wfr=spider&for=pc