一、keepalived简介
Keepalived 是一种高性能的服务器高可用或热备解决方案, Keepalived 可以用来防止服务器单点故障的发生,通过配合 Haproxy 可以实现 web 前端服务的高可用。
Keepalived 以 VRRP 协议为实现基础,用 VRRP 协议来实现高可用性(HA)。
VRRP(Virtual Router Redundancy Protocol)协议是用于实现路由器冗余的协议, VRRP 协议将两台或多台路由器设备虚拟成一个设备,对外提供虚拟路由器 IP(一个或多个),而在路由器组内部,如果实际拥有这个对外 IP 的路由器如果工作正常的话就是 MASTER,或者是通过算法选举产生。
MASTER 实现针对虚拟路由器 IP 的各种网络功能,如 ARP 请求, ICMP,以及数据的转发等;其他设备不拥有该虚拟 IP,状态是 BACKUP,除了接收 MASTER 的VRRP 状态通告信息外,不执行对外的网络功能。
当主机失效时, BACKUP 将接管原先 MASTER 的网络功能。
VRRP 协议使用多播数据来传输 VRRP 数据, VRRP 数据使用特殊的虚拟源 MAC 地址发送数据而不是自身网卡的 MAC 地址, VRRP 运行时只有 MASTER 路由器定时发送 VRRP 通告信息,表示 MASTER 工作正常以及虚拟路由器 IP(组), BACKUP 只接收 VRRP 数据,不发送数据,如果一定时间内没有接收到 MASTER 的通告信息,各 BACKUP 将宣告自己成为 MASTER,发送通告信息,重新进行 MASTER 选举状态。
二、keepalived单播模式
如果网路不允许组播(可能是交换机策略设置),又要使用keepalived,那么开启单播。
使用单播模式,即使网络环境内有相同的virtual_router_id,也没有关系。
默认是抢占式,组播的 方式 ,当master down 时,backup 会接管vip 地址。
组播的缺点: keepalived在组播模式下所有的信息都会向224.0.0.18的组播地址发送,产生众多的无用信息,并且会产生干扰和冲突,所以需要将其组播的模式改为单拨。这是一种安全的方法,避免局域网内有大量的keepalived造成虚拟路由id的冲突。单播模式需要关闭vrrp_strict,严格遵守vrrp协议这个选项。
二、keepalived非抢占模式
抢占式的缺点:会因为网络抖动,vip频繁飘移, 造成不必要的切换,推荐使用非抢占式。
配置了 keepalived 非抢占模式,注意点如下:
(1) 主设备、 从设备中的 state 都设置为 BACKUP
(3) 默认主设备(priority 值大的 Keepalived 节点) 配置一定要加上 nopreempt,否则非抢占不起作用
(4) 防火墙配置允许组播(主、备两台设备上都需要配置, keepalived 使用 224.0.0.18 作为 Master 和Backup 健康检查的通信 IP)
如何判断脑裂?
分别在两台机查看当前服务器是否拥有虚拟IP,如果两台服务器都拥有,则说明发生了脑裂,证明目前双机通信出现问题,产生此问题的原有在于两台服务器都探测不到组内其他服务器的状态(心跳请求无法正常响应),最后启来的keepalived私自判定另一台先启来的keepalived服务器挂起,则抢占虚拟IP,脑裂的出现是不被允许的。
造成脑裂的原因:通过查看VRRP通信原理发现VRRP基于报文实现的。master设置(advert_int 1 )一定时间发送一个报文给backup。如果backup没有收到就自己成为master。可推出导致问题的原因是因为backup没有收到报文,所以自己成为了master。
VRRP控制报文只有一种:VRRP通告(advertisement)。它使用IP多播数据包进行封装,组地址为224.0.0.18,发布范围只限于同一局域网内。这保证了VRID在不同网络中可以重复使用。为了减少网络带宽消耗只有主控路由器才可以周期性的发送VRRP通告报文。备份路由器在连续三个通告间隔内收不到VRRP或收到优先级为0的通告后启动新的一轮VRRP选举。
如果使用 非抢占模式,就不能通过优先级 priority 来判断谁应该是MASTER或者SLAVE,而应该根据检测脚本的返回值。
三、非抢占模式+单播模式配置文件示例
MASTER
# cat /etc/keepalived/keepalived.conf
####################################################################
! Configuration File for keepalived
global_defs {
router_id keepalived
}
vrrp_script chk_nginx {
script "/etc/keepalived/check_nginx.sh"
interval 2
fall 1
rise 1
}
vrrp_instance nginx {
state BACKUP
interface ens33
virtual_router_id 51
priority 100
advert_int 1
nopreempt
authentication {
auth_type PASS
auth_pass 11111
}
unicast_src_ip 192.168.1.104
unicast_peer {
192.168.1.106
}
virtual_ipaddress {
192.168.1.120/24
}
track_script {
chk_nginx
}
}
####################################################################
SLAVE
# cat /etc/keepalived/keepalived.conf
#############################################################
! Configuration File for keepalived
global_defs {
router_id keepalived
}
vrrp_script chk_nginx {
script "/etc/keepalived/check_nginx.sh"
interval 2
fall 1
rise 1
}
vrrp_instance nginx {
state BACKUP
interface ens33
virtual_router_id 51
priority 90
advert_int 1
nopreempt
authentication {
auth_type PASS
auth_pass 11111
}
unicast_src_ip 192.168.1.106
unicast_peer {
192.168.1.104
}
virtual_ipaddress {
192.168.1.120/24
}
track_script {
chk_nginx
}
}
#############################################################
相同的检测脚本
# cat /etc/keepalived/check_nginx.sh
##########################################
#!/bin/bash
if ! ps -C nginx --no-header > /dev/null 2>&1; then
systemctl start nginx
sleep 1
if ! ps -C nginx --no-header > /dev/null 2>&1; then
exit 1
fi
fi
##########################################
四、参考
keepalived详细配置说明
https://www.huweihuang.com/linux-notes/keepalived/keepalived-conf.html
keepalived抢占VIP(单播模式解决)
https://www.jianshu.com/p/f7a5ad913a48
keepalived开启非抢占模式
https://soulchild.cn/1254.html
keepalived绑定单播地址、非抢占模式及LVS的TCP模式的高可用
https://www.cnblogs.com/struggle-1216/p/12098241.html