分布式选举-Bully算法-2 代码实现

Bully 算法实现

设定集群中有三个节点,通过Bully算法实现选主。节点之间的通信使用的是自我实现的Remoting组件,基于Netty开发,可以以同步,异步的方式发起通信。在后续《分布式通信》系列的文章中,会向大家详细分析Remoting组件。

分布式选举的项目名称:justin-distribute-election
整体结构如图:


image.png

节点和集群类:
Node:表示集群中的节点,包含节点ID,节点状态,节点元数据等属性。

// 节点ID
private final UUID nodeId = UUID.randomUUID();
// 节点状态
private final AtomicReference<NodeStatus> status =
new AtomicReference<NodeStatus>(NodeStatus.UNKNOWN);
// 选举周期,节点发起一次选举,周期值加1。所有的节点必须在相同的周期内。
private final AtomicInteger epoch = new AtomicInteger(0);
private final String[] nodesAddress = PropertiesUtil.getNodesAddress();
// 处理节点请求消息的线程池
private final ExecutorService processorExecutor =
Executors.newFixedThreadPool(PropertiesUtil.getProcessorThreads());
private final Timer timer = new Timer("NodeMessage", true);
// 节点元数据,用于节点间的数据传输
private final Metadata metadata;
// 集群,集群中存储所有节点的元数据,用于选举。
private final Cluster cluster;

Cluster:表示集群,包含所有节点的元数据,主节点,选举周期等属性。

// 选举周期,与各节点一致
private final AtomicInteger epoch = new AtomicInteger(0);
// Key:节点的nodeId,Value:节点的元数据
private final ConcurrentMap<String, Metadata> nodes =
new ConcurrentHashMap<String, Metadata>();
// 选举出的主节点
private AtomicReference<Metadata> leader =
new AtomicReference<Metadata>();

NodeStatus:表示节点的状态,包含三种状态,初始状态(UNKNOWN)、存活状态(ALIVE)、死亡状态(DEAD)。

public enum NodeStatus {
    UNKNOWN,
    ALIVE,
    DEAD
}

节点启动:
-Node节点启动时,在内部启动了4个线程:
-server端线程,用于接收其他节点发送的消息;
-client端线程,用于向其他节点发送消息;
-元数据同步线程,用于在集群内同步各节点的元数据;
-选举线程,用于在集群内选举主节点;

public synchronized void start() {
    logger.info("Prepare start node[id: {}, address: {}:{}]", nodeId, host, port);
    if (status.get() != NodeStatus.ALIVE) {
        try {
            // 在集群中加入本地节点
            cluster.addNode(nodeId, metadata);
           // 启动Server,并注册消息处理器
            server = new NettyRemotingServer(new NettyServerConfig(host, port));
            server.registerProcessor(MessageType.CLUSTER_SYNC, new ClusterSyncRequestProcessor(this), processorExecutor);
            server.registerProcessor(MessageType.ELECTION, new ElectionRequestProcessor(), processorExecutor);
            server.registerProcessor(MessageType.VICTORY, new VictoryRequestProcessor(this), processorExecutor);
            server.start();
           // 启动Client
            client = new NettyRemotingClient(new NettyClientConfig());
            client.start();
            // 本地节点状态设置为ALIVE
            setStatus(NodeStatus.ALIVE);
            metadata.setNodeStatus(NodeStatus.ALIVE);
            // 周期线程,用于在集群内同步各节点的元数据
            timer.scheduleAtFixedRate(new TimerTask() {
                @Override
                public void run() {
                    try {
                        Node.this.clusterSync(metadata);
                    }catch (Throwable e) {
                        logger.error("Cluster sync request failure: " + e.getMessage());
                    }
                }
            }, 2*1000, 10*1000);
            // 周期线程,用于选主
            timer.scheduleAtFixedRate(new TimerTask() {
                @Override
                public void run() {
                    try {
                        Node.this.electLeader();
                    }catch (Throwable e) {
                        logger.error("Elect leader failure: " + e.getMessage());
                    }
                }
            }, 5*1000, 5*1000);
        }catch (Exception e) {
            e.printStackTrace();
        }
    }else {
        logger.info("Node is alive " + this.toString());
    }
}

两种周期线程的作用,如下图:


image.png

Cluster Sync:
元数据同步线程,它的作用在于,在每个节点中维护一个集群所有节点的元数据列表,用于选主。还有就是探测节点是否处于存活状态。

private void clusterSync(Metadata metadata) throws Exception {
    for(String nodeAddress : nodesAddress) {
        if (!nodeAddress.equals(localAddr)) {
            // 向其他节点发送本地节点的元数据
            RemotingMessage response = client.invokeSync(nodeAddress, ClusterSyncMessage.getInstance().request(metadata), 3 * 1000);
            String peerNodeId = cluster.getNodeIdByaddr(nodeAddress);
            if (peerNodeId != null) {
                // 如果超过3次没有响应,则设置节点状态为DEAD
                if (response == null) {
                    if (nodeDetectFailNums.containsKey(peerNodeId)) {
                        int failNums = nodeDetectFailNums.get(peerNodeId);
                        if (failNums >= 3) {
                            cluster.getNodes().get(peerNodeId).setNodeStatus(NodeStatus.DEAD);
                        } else {
                            nodeDetectFailNums.put(peerNodeId, ++failNums);
                        }
                    } else {
                        nodeDetectFailNums.put(peerNodeId, 1);
                    }
                } else {
                    nodeDetectFailNums.put(peerNodeId, 0);
                }
            }
        }
    }
}

元数据同步消息的处理类是:ClusterSyncRequestProcessor.class

public RemotingMessage processRequest(ChannelHandlerContext ctx, 
RemotingMessage request) throws Exception {
    Metadata peerNodeMetadata = ClusterSyncMessage.getInstance().getPeerNodeMetadata(request);
    logger.info("[" + node.getMetadata() + " ===> " + peerNodeMetadata + "] cluster sync!");
    // 将接收的节点元数据存入到本地元数据列表
    node.getCluster().addNode(peerNodeMetadata.getNodeId(), peerNodeMetadata);
    // 响应ALIVE消息
    byte[] res = "ALIVE".getBytes(Charset.forName("UTF-8"));
    request.setMessageBody(res);
    return request;
}

Elect Leader:
选举线程,它的作用在于检测集群中是否有主节点或者主节点是否存活,否则发起选举。

private void electLeader() throws Exception {
    logger.info("[" + metadata + "] cluster leader: " + cluster.getLeader());
    if (cluster.getNodes().size() > 1) {
        Metadata leader = cluster.getLeader();
        // 判断集群中是否有主节点或者主节点是否存活,没有则发起选举。
        if ((leader == null) || (leader.getNodeStatus() !=
            NodeStatus.ALIVE)) {
            logger.info("Starting election ...");
            epoch.getAndIncrement();
            metadata.setEpoch(epoch.get());
            // 获取集群中比自己ID大的所有节点
            List<Metadata> largerNodes = cluster.largerNodes(metadata);
            // 如果没有则向其他节点发送Victory消息,宣布为主节点
            if (largerNodes.isEmpty()) {
                if (metadata.getNodeStatus() != NodeStatus.ALIVE) {
                    logger.warn("Node is not alive: " + metadata);
                }else {
                    cluster.getNodes().get(metadata.getNodeId().toString()).setEpoch(epoch.get());
                    cluster.setLeader(metadata);
                    List<Metadata> otherNodes = cluster.otherNodes(metadata);
                    for (Metadata otherNode : otherNodes) {
                        client.invokeOneway(otherNode.getNodeAddress(), VictoryMessage.getInstance().request(metadata), 3*1000);
                    }
                }
            }else {
                // 向比自己ID大的所有节点发送Election消息
                for (Metadata largerNode : largerNodes) {
                    RemotingMessage response = client.invokeSync(largerNode.getNodeAddress(), ElectionMessage.getInstance().request(metadata), 3*1000);
                    String res = new String(response.getMessageBody(), Charset.forName("UTF-8"));
                    logger.info("Election response: " + res);
                }
            }
        }
    }
}

Election消息的处理类是:ElectionRequestProcessor.class

public RemotingMessage processRequest(ChannelHandlerContext ctx, RemotingMessage request) throws Exception {
    Metadata peerNodeMetadata = ElectionMessage.getInstance().getPeerNodeMetadata(request);
    logger.info("[ ===> " + peerNodeMetadata + "] election!");
    // 响应ALIVE消息
    byte[] res = "ALIVE".getBytes(Charset.forName("UTF-8"));
    request.setMessageBody(res);
    return request;
}

Victory消息的处理类是:VictoryRequestProcessor.class

public RemotingMessage processRequest(ChannelHandlerContext ctx, RemotingMessage request) throws Exception {
    Metadata peerNodeMetadata = VictoryMessage.getInstance().getPeerNodeMetadata(request);
    logger.info("[" + node.getMetadata() + " ===> " + peerNodeMetadata + "] victory!");
    // 更新选举周期
    node.setEpoch(peerNodeMetadata.getEpoch());
    node.getCluster().setEpoch(peerNodeMetadata.getEpoch());
    // 在集群中设置主节点
    node.getCluster().setLeader(peerNodeMetadata);
    return null;
}

至此,根据Bully算法的选主代码实现完成。

下一篇文章《分布式选举-Raft算法-1 Leader选举 原理》讲解典型的多数派投票选举算法Raft的选举原理。


代码地址:https://github.com/Justin02180218?tab=repositories

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,884评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,755评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,369评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,799评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,910评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,096评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,159评论 3 411
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,917评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,360评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,673评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,814评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,509评论 4 334
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,156评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,882评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,123评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,641评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,728评论 2 351