1.为啥要做集群?
1)作用:集群主要用于实现高可用与负载均衡。高可用:如果集群中的某些 MQ 服务器不可用,客户端还可以连接到其他 MQ 服务器。负载均衡:在高并发的场景下,单台 MQ 服务器能处理的消息有限,可以分发给多台 MQ 服务器。
2)RabbitMQ 有两种集群模式:普通集群模式和镜像队列模式。
2.RabbitMQ 如何支持集群?
1).应用做集群,需要面对数据同步和通信的问题。因为 Erlang 天生具备分布式的特性,所以 RabbitMQ 天然支持集群,不需要通过引入 ZK 或者数据库来实现数据同步。
3.RabbitMQ 的节点类型?
1).集群两种节点类型:一种是磁盘节点(Disc Node),一种是内存节点(RAM Node)。
2)磁盘节点:将元数据(包括队列名字属性、交换机的类型名字属性、绑定、vhost)放在磁盘中。
3) 内存节点:将元数据放在内存中。(内存节点会将磁盘节点的地址存放在磁盘(不然重启后就没有办法同步数据了)。如果是持久化的消息,会同时存放在内存和磁盘。)
4.普通集群
1)为什么不直接把队列的内容(消息)在所有节点上复制一份?主要是出于存储和同步数据的网络开销的考虑,如果所有节点都存储相同的数据,就无法达到线性地增加性能和存储容量的目的(堆机器)。
2)缺点:不能保证队列的高可用性,因为队列内容不会复制
5.镜像集群
1)第二种集群模式叫做镜像队列。镜像队列模式下,消息内容会在镜像节点间同步,可用性更高。不过也有一定的副作用,系统性能会降低,节点过多的情况下同步的代价比较大。
6.高可用
1)问题:集群搭建成功后,如果有多个内存节点,那么生产者和消费者应该连接到哪个内存节点?如果在我们的代码中根据一定的策略来选择要使用的服务器,那每个地方都要修改,客户端的代码就会出现很多的重复,修改起来也比较麻烦。
2)解决:负载均衡的组件
3)负载分类:四层负载和七层负载。
四层负载:作在 OSI 模型的第四层,即传输层(TCP 位于第四层),它是根据 IP端口进行转发(LVS 支持四层负载)。RabbitMQ 是 TCP 的 5672 端口。
七层负载:工作在第七层,应用层(HTTP 位于第七层)。可以根据请求资源类型分配到后端服务器(Nginx 支持七层负载;HAProxy 支持四层和七层负载!
4)问题:负载组件挂了怎么办?
1.负载组件挂了意味着客户端就无法连接到任意一台 MQ 的服务器了。所以负载软件本身也需要做一个集群。新的问题又来了,如果有两台负载的软件,客户端应该连哪个?
2.解决方案:负载之上再负载?陷入死循环了。---》换思路
3.要求: 我们应该需要这样一个组件:1)它本身有路由(负载)功能,可以监控集群中节点的状态(比如监控HAProxy),如果某个节点出现异常或者发生故障,就把它剔除掉。2)为了提高可用性,它也可以部署多个服务,但是只有一个自动选举出来的 MASTER 服务器(叫做主路由器),通过广播心跳消息实现。3)MASTER 服务器对外提供一个虚拟 IP,提供各种网络功能。也就是谁抢占到 VIP,就由谁对外提供网络服务。应用端只需要连接到这一个 IP 就行了。
4.解决方案:VRRP协议---》虚拟路由冗余协议 Virtual Router RedundancyProtocol,这个组件就是 Keepalived,它具有 Load Balance 和 High Availability的功能。
7.基于 Docker 安装 HAproxy 负载+Keepalived 高可用
1)模型
2)步骤:1.我们规划了两个内存节点,一个磁盘节点。所有的节点之间通过镜像队列的方式同步数据。内存节点用来给应用访问,磁盘节点用来持久化数据。2.为了实现对两个内存节点的负载,我们安装了两个 HAProxy,监听两个 5672和 15672 的端口。3.安装两个 Keepalived,一主一备。两个 Keepalived 抢占一个VIP192.168.8.220。谁抢占到这个 VIP,应用就连接到谁,来执行对 MQ 的负载
3)分析:这种情况下,我们的 Keepalived 挂了一个节点,没有影响,因为 BACKUP 会变成 MASTER,抢占 VIP。HAProxy 挂了一个节点,没有影响,我们的 VIP 会自动路由的可用的 HAProxy 服务。RabbitMQ 挂了一个节点,没有影响, 因为 HAProxy会自动负载到可用的节点。