使用keepalived搭建高可用服务

1. 理论篇

1.1 Keepalived 与 VRRP

如果网络中只部署一个路由器,那么这个路由器坏了,整个网络就会瘫痪。因此,在高可用设计下,一般都会部署一对路由器,一主一备。当主路由器坏了之后,就启用备用路由器。

虚拟路由冗余协议(Virtual Router Redundancy Protocol,简称VRRP)就是为以上情景设计的,它是由IETF提出的解决局域网中配置静态网关出现单点失效现象的路由协议。其原理如下:

  • 设定一个虚拟IP(Virtual IP Address,VIP)
  • 多个冗余设备(服务器、路由器等)在选举阶段确定谁将最终获得这个虚拟IP
  • 在同一时刻只允许一个设备拥有该虚拟IP
  • VRRP检测到主设备发生故障时,迅速将虚拟IPpiao'yi到备用设备

服务器高可用问题也可以用相同的方法解决,Keepalived就是这样一款产品,它同时实现了该协议的第二版和第三版。除此之外,Keepalived还基于IPVS(Linux IP Virtual Server)实现了负载均衡功能。

1.2 VRRP工作流程

  1. 给每个VRRP的服务器设置一个权重
  2. 权重最高的服务器将获得虚拟IP
  3. 确定主机以后,主机将定期给备机发送心跳消息
  4. 一旦主机出现故障,最高权重的备机将获得虚拟IP继续提供服务
  5. 如果运行在抢占模式,一旦有更高权重的服务器加入,就会自动获得虚拟IP,成为主机

注意:

  • 协议规定主服务器权重为255,其他备机权重小于255。实际应用中,只要保证主服务器权重最高即可。
  • 当主机接管虚拟IP时,会广播一个ARP消息,通知网络中的其他服务器与虚拟IP关联的MAC地址。这样就可以保证2层网络通信可以正常运行,同时可以加快虚拟IP的漂移。

1.3 数据包格式

Picture2_2.png

通过VRRP的消息包,我们可以更好地了解VRRP是如何工作的。如上是通过Wireshark获取的VRRP广播消息:

  • 无论以太网还是IP网消息的目的地址都是组播地址,意味着消息将会发给网络上所有的主机

  • VRRP使用112端口,注意防火墙设置

  • 网络中可能有多个VRRP实力,需要设置唯一的VRID

2. 实践篇

2.1 安装Keepalived

下面以ubuntu 18.04 LT为例:

# 通过snap安装
snap install keepalived --classic

# 查看版本
keepalived --version

# 检查运行状态
snap services

# 启动/停止服务
snap start keepalived
snap stop keepalived

2.2 配置Keepalived

Keepalived的配置文件位于/etc/keepalived/keepalived.conf

# 主机配置
vrrp_instance VRRP_1 {              # 设定一个VRRP的实例,名称为V1
        state               MASTER  # 设定服务器的初始状态为 MASTER
        interface           enp0s3  # 绑定网卡
        virtual_router_id   60      # 网络中唯一的 VRRP 实例 ID
        priority            200     # 权重
        advert_int          1       # 每隔1秒广播消息
        authentication {
              auth_type PASS        # 认证模式:文本密码
              auth_pass 12345       # 密码
        }
        virtual_ipaddress {
              192.168.1.222/24      # 虚拟IP
        }
}

# 备机配置
vrrp_instance VRRP_1 {

        state               BACKUP
        interface           enp0s3
        virtual_router_id   60
        priority            100
        advert_int          1
        authentication {
              auth_type PASS
              auth_pass 12345
        }
        virtual_ipaddress {
              192.168.1.222/24
        }
}

配置好之后,重启一下keepalived服务,可以看到以下网络信息:

# 主机,拥有虚拟IP
ip -brief address show

lo          UNKNOWN     127.0.0.1/8 ::1/128 
enp0s3      UP          192.168.1.174/24 192.168.1.222/24 fe80::a00:27ff:fee6:cf3b/64

# 备机
ip -br a

lo          UNKNOWN     127.0.0.1/8 ::1/128 
enp0s3      UP          192.168.1.175/24 fe80::a00:27ff:fe0c:b917/64

如果我们将主机服务关闭,虚拟IP会自动切换到备机:

# 主机
snap stop keepalived.daemon

ip -br a

lo               UNKNOWN        127.0.0.1/8 ::1/128 
enp0s3           UP             192.168.1.174/24 fe80::a00:27ff:fee6:cf3b/64

# 备机
ip -br a

lo          UNKNOWN    127.0.0.1/8 ::1/128 
enp0s3      UP         192.168.1.175/24 192.168.1.222/24 fe80::a00:27ff:fe0c:b917/64


2.3 监控VRRP通信

# 主机
tcpdump proto 112

tcpdump: verbose output suppressed, use -v or -vv for full protocol decode
listening on enp0s3, link-type EN10MB (Ethernet), capture size 262144 bytes
05:05:00.615010 IP dev4 > vrrp.mcast.net: VRRPv2, Advertisement, vrid 60, prio 200, authtype simple, intvl 1s, length 20
05:05:01.615515 IP dev4 > vrrp.mcast.net: VRRPv2, Advertisement, vrid 60, prio 200, authtype simple, intvl 1s, length 20
05:05:02.616139 IP dev4 > vrrp.mcast.net: VRRPv2, Advertisement, vrid 60, prio 200, authtype simple, intvl 1s, length 20
05:05:03.616957 IP dev4 > vrrp.mcast.net: VRRPv2, Advertisement, vrid 60, prio 200, authtype simple, intvl 1s, length 20
05:05:04.617905 IP dev4 > vrrp.mcast.net: VRRPv2, Advertisement, vrid 60, prio 200, authtype simple, intvl 1s, length 20
05:05:05.618120 IP dev4 > vrrp.mcast.net: VRRPv2, Advertisement, vrid 60, prio 200, authtype simple, intvl 1s, length 20
^C
6 packets captured
6 packets received by filter
0 packets dropped by kernel

3. 进阶篇

默认情况下,Keepalived通过心跳监测主机故障。除此之外,Keepalived还提供更细粒度的故障监测方法。

3.1 监测进程

以监测 Apache服务为例:

vrrp_track_process track_apache {   # 定义名为 track_apache 的进程监测指令
      process   httpd   # Apache服务进程
      weight    10      # 权重
}

vrrp_instance VRRP_1 {              
        state               MASTER  
        interface           enp0s3  
        virtual_router_id   60      
        priority            200     # 如果http运行正常,权重为 200 + 10 = 210,否则为200      
        advert_int          1       
        authentication {
              auth_type PASS        
              auth_pass 12345       
        }
        virtual_ipaddress {
              192.168.1.222/24      
        }
        track_process {     
              track_apache  # 使用进程监测指令
        }
}

3.2 检测文件

如果文件权重为0,那么文件中任何非0值,都认为是故障。

如果文件权重为非0值,那么权重为文件中的值乘以文件权重。

vrrp_track_file track_app_file {    # 定义名为 track_app_file的文件监测指令
      file /var/run/my_app/vrrp_track_file
}

vrrp_instance VRRP_1 {              
        state               MASTER  
        interface           enp0s3  
        virtual_router_id   60      
        priority            200 # 如果文件中的值为5,权重为 200 + 5 * 1 = 205
        advert_int          1       
        authentication {
              auth_type PASS        
              auth_pass 12345       
        }
        virtual_ipaddress {
              192.168.1.222/24      
        }
        track_process {     
              track_app_file weight 1   # 使用文件监测指令,权重为1
        }
}

3.3 检测网卡

假设一个负载均衡器有两个网卡,一个是对外的虚拟IP,一个是面向后端服务器。我们可以监测面向后端服务器的网络连接是否故障。

vrrp_instance VRRP_1 {              
        state               MASTER  
        interface           enp0s3  
        virtual_router_id   60      
        priority            200 # 如果网卡正常,权重为 200 + 5 = 205
        advert_int          1       
        authentication {
              auth_type PASS        
              auth_pass 12345       
        }
        virtual_ipaddress {
              192.168.1.222/24      
        }
        track_interface {       
              enth0 weight 5    # 使用网卡监测指令,权重为5
        }
}

3.4 检测脚本

Keepalived支持通过任意脚本来检测主机状态。以下例子中,如果脚本返回任何非0值,则进入异常状态。

脚本示例/usr/local/bin/keepalived_check.sh

#!/bin/bash

/usr/bin/ping -c 1 -W 1 8.8.8.8 > /dev/null 2>&1

Keepalived配置:

vrrp_script keepalived_check {  # 定义监测脚本
      script "/usr/local/bin/keepalived_check.sh"
      interval 1                # 脚本每隔1秒执行一次
      timeout 5                 # 脚本超时时间 5秒
      rise 3                    # 脚本成功返回3次,算健康
      fall 3                    # 脚本返回3次失败,算失败
}

vrrp_instance VI_1 {
      state MASTER
      interface eth0
      virtual_router_id 51
      priority 244
      advert_int 1
      authentication {
         auth_type PASS
         auth_pass 12345
      }
      virtual_ipaddress {
         192.168.122.200/24
      }
      track_script {
         keepalived_check    #使用监测脚本
      }
}

3.5 通知脚本

Keepalive支持触发通知脚本,通知脚本将收到4个参数:

  • VRRP组或VRRP实例
  • VRRP组或VRRP实例名称
  • VRRP组或VRRP实例将要进入的状态
  • 权重

通知脚本示例:

# /usr/local/bin/keepalived_notify.sh
#!/bin/bash

echo "$1 $2 has transitioned to the $3 state with a priority of $4" > /var/run/keepalived_status

Keepalived配置:

# keepalived.conf
vrrp_script keepalived_check {
      script "/usr/local/bin/keepalived_check.sh"
      interval 1
      timeout 5
      rise 3
      fall 3
}

vrrp_instance VI_1 {
      state MASTER
      interface eth0
      virtual_router_id 51
      priority 244
      advert_int 1
      authentication {
         auth_type PASS
         auth_pass 12345
      }
      virtual_ipaddress {
         192.168.122.200/24
      }
      track_script {
         keepalived_check
      }
      notify "/usr/local/bin/keepalived_notify.sh"  # 启用通知脚本
}
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342