今天在工作中同事问我在高可用集群下如何获取活跃的NameNode的信息。当时有点懵,一时间不知道咋获取。
然后度娘了一下,最后找到了办法。
首先先说一下啥事高可用
HA的意思是High Availability高可用,指当当前工作中的机器宕机后,会自动处理这个异常,并将工作无缝地转移到其他备用机器上去,以来保证服务的高可用。
HA方式安装部署才是最常见的生产环境上的安装部署方式。Hadoop HA是Hadoop 2.x中新添加的特性,包括NameNode HA 和 ResourceManager HA。因为DataNode和NodeManager本身就是被设计为高可用的,所以不用对他们进行特殊的高可用处理。
也就是说,活跃NameNode的ip不固定,一开始我也是开在这里不知道如何下手,毕竟不是自己搭建的环境拿来玩的,一般情况下你都接触不到配置文件,所以怎么获取活跃的NameNode IP,同事一开始是通过便利所有的NameNode 虽然实现了,但是这个也是别人提供了可能IP的结果,所以也不是最优的
下面是我通过查找资料get到的方法,是目前为止我找到的最优方法,在此记录一下
import org.apache.hadoop.fs.FileSystem
import org.apache.hadoop.hdfs.HAUtil
def getActiveNameNode() = {
val conf = new Configuration()
var fileSystem: FileSystem = null
fileSystem = FileSystem.get(conf)
try {
val active: InetSocketAddress = HAUtil.getAddressOfActive(fileSystem)
val address: InetAddress = active.getAddress
val ip: String = address.getHostAddress
val port: Int = active.getPort
s"hdfs://" + ip + ":" + port
} catch {
case e: Exception => e.printStackTrace()
} finally {
null
}
}
留码必留包
如果有更好的方法 欢迎留言