最近运维的项目负载均衡服务器用的是LVS服务器,借此了解一下LVS及其使用方法。
以下内容是对LVS作者关于LVS博客的笔记。
1. 背景
对于硬件和软件方法实现高可伸缩,高可用网络服务的需求不断增长,体现为:
- 可伸缩性(Scalability),当服务的负载增长时,系统能被扩展来满足需求,且不降低服务质量
- 高可用性(Availability),尽管部分硬件和软件会发生故障,郑哥系统的服务必须是7*24可用的。
- 可管理性(Manageability),整个系统可能在物理上喊打,但是应该容易管理
- 价格有效性(Cost-effectiveness),整个系统实现应该是经济的,易支付的。
2. 服务器集群系统
通过高性能网络或局域网互联的服务器集群正成为实现高可伸缩的、高可用网络服务的有效结构。
2.1 优点
这种松耦合结构的服务器集群系统有下列优点:
性能
网络服务的工作负载通常是大量相互独立的任务,通过一组服务器分而治之,可以获得很高的整体性能。性能/价格比
组成集群系统的PC服务器或RISC(Reduced Instruction Set Computer,精简指令集计算机)服务器和标准网络设备因为大规模生产降低成本,价格低,具有最高的性能/价格比。若整体性能随着结点数的增长而接近线性增加,该系统的性能/价格比接近于PC服务器。所以,这种松耦合结构比紧耦合的多处理器系统具有更好的性能/价格比。可伸缩性
集群系统中的结点数目可以增长到几千个,乃至上万个,其伸缩性远超过单台超级计算机。高可用性
在硬件和软件上都有冗余,通过检测软硬件的故障,将故障屏蔽,由存活结点提供服务,可实现高可用性。
2.2 挑战
用服务器集群系统实现可伸缩网络服务也存在很多挑战性的工作:
透明性(Transparency)
如何高效得使得多个独立的计算机组成的松耦合的集群系统构成一个虚拟服务器;客户端应用程序与集群系统交互时,就像与一台高性能,高可用的服务器交互一样,客户端无需作任何修改。部分服务器的切入和切出不会中断服务,这对用户也是透明的。性能(Performance)
性能要接近线性加速,这需要设计很好的软硬件的体系结构,消除系统可能存在的瓶颈。。将负载较均衡的调度到各台服务器上。高可用性(Availability)
需要设计和实现很好的系统资源和故障检测的体系架构。当发现一个模块失效时,要这个模块上提供的服务迁移到其他模块上。在理想情况下,这种迁移是即时的,自动的。可管理性(Manageability)
要使集群系统变得易管理,就像管理一个单一映象系统一样。在理想情况下,软硬件模块的插入能做到即插即用(Plug&Play)。可编程性(Programmability)
在集群系统上,容易开发应用程序。
3. Linux Virtual Server项目
针对高可伸缩,高可用网络服务要求,提出的基于IP层和基于内容请求分发的负载平衡调度解决方法,并在Linux内核中实现,将一组服务器构成一个实现可伸缩的,高可用的网络服务的虚拟服务器。
这个虚拟服务器的体系结构为:
一组服务器通过告诉的局域网或者地理分布的广域网相互连接,在前端有一个负载调度器(Loader Balancer)。负载调度器能无缝地将网络请求调度到真实服务器上,从而使得服务器集群的结构对用户是透明的,客户访问集群系统提供的网络服务就像访问一台高性能,高可用的服务器一样。
客户程序不受服务器集群的影响不需任何修改。
系统的伸缩性通过在服务器机群中透明地加入和删除节点来达到。
系统的高可用性通过检测节点或服务进程故障和正确的重置系统达到。
这些负载调度技术在Linux内核中实现,称之为Linux虚拟服务器(Linux Virtual Server)。
Linux Virtual Server项目的目标
使用集群技术和Linux操作系统实现一个高性能、高可用的服务器,它具有很好的可伸缩性(Scalability)、可靠性(Reliability)和可管理性(Manageability)。
LVS项目提供了一个实现可伸缩网络服务的Linux Virtual Server框架
- 提供了含有三种IP负载均衡技术的IP虚拟服务器软件IPVS
- 基于内容请求分发的内核Layer-7交 换机KTCPVS
- 集群管理软件
- 可以利用LVS框架实现高可伸缩的、高可用的Web、Cache、Mail和Media等网络服务
- 在此基础上,可以开 发支持庞大用户数的、高可伸缩的、高可用的电子商务应用
3.1 IP虚拟服务器软件IPVS
调度器实现的技术中,IP负载均衡技术效率是最高的。
IPVS实现了三种IP负载均衡技术:
- Virtual Server via Network Address Translation(VS/NAT)
通过网络地址转换,调度器重写请求报文的目标地址,根据预设的调度算法,将请求分派给后段的真实服务器;真实服务器响应报文通过调度服务器时,报文的源地址被重写,再返回给客户,完成整个负载调度过程。 - Virtual Server via IP Tunneling(VS/TUN)
采用NAT技术时,由于请求和响应报文都需要经过调度器地址重写,当客户请求越来越多时,调度器的处理能力将成为瓶颈。伟了解决这个问题,调度器吧请求报文通过IP隧道转发至真实服务器,而真实服务器将响应直接返回给客户,所以调度服务器只处理请求报文。由于一般网络服务应答比请求报文大很多,采用VS/TUN技术,集群系统的最大吞吐量可以提高10倍。 - Virtual Server via Direct Routing(VS/DR)
VS/DR通过改写请求报文的MAC地址,将请求发送到真实服务器,而真实服务器将响应直接返回给客户。同VS/TUN技术一样,VS/DR技术可极大地 提高集群系统的伸缩性。这种方法没有IP隧道的开销,对集群中的真实服务器也没有必须支持IP隧道协议的要求,但是要求调度器与真实服务器都有一块网卡连 在同一物理网段上。
IPVS调度器实现了八种负载调度算法:
轮询(Round Robin)
调度器通过"轮叫"调度算法将外部请求按顺序轮流分配到集群中的真实服务器上,它均等地对待每一台服务器,而不管服务器上实际的连接数和系统负载。加权轮训(Weighted Round Robin)
调度器通过"加权轮叫"调度算法根据真实服务器的不同处理能力来调度访问请求。这样可以保证处理能力强的服务器处理更多的访问流量。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。最少链接(Least Connections)
度器通过"最少连接"调度算法动态地将网络请求调度到已建立的链接数最少的服务器上。如果集群系统的真实服务器具有相近的系统性能,采用"最小连接"调度算法可以较好地均衡负载。加权最少链接(Weighted Least Connections)
在集群系统中的服务器性能差异较大的情况下,调度器采用"加权最少链接"调度算法优化负载均衡性能,具有较高权值的服务器将承受较大比例的活动连接负载。调度器可以自动问询真实服务器的负载情况,并动态地调整其权值。基于局部性的最少链接(Locality-Based Least Connections)
“基于局部性的最少链接”调度算法是针对IP地址的负载均衡,目前主要用于Cache集群系统。该算法根据请求的目标IP地址找出该目标地址最近使用的服务器,若该服务器是可用的且没有超载,将请求发送到该服务器;若服务器不存在,或者该服务器超载且有服务器处于一半的工作负载,则用“最少链接”的原则选出一个可用的服务器,将请求发送到该服务器。带复制的基于局部性最少链接(Locality-Bases Least Connections with Replication)
“带复制的基于局部性最少链接”调度算法也是针对目标IP地址的负载均衡,目前主要用于Cache集群系统。它与LBLC算法的不同之处在于它要维护从一个目标IP地址到一组服务器的映射,而LBLC系统维护一个目标IP到一台服务器的映射。该算法根据请求的IP地址从目标IP地址对应服务器组,按“最小连接”原则从服务器组中选出一台服务器,若服务器没有超载,将请求发送到该服务器,如果服务器超载,按照“最小连接”原则从这个集群中选出一台服务器,将该服务器驾到服务器组中,将请求发送到该服务器。同时,当该服务器组有一段时间没有修改,将最忙的服务器从服务器组中删除,以降低复制的程度。目标地址散列(Destination Hashing)
“目标地址散列”调度算法根据请求的目标IP地址,作为散列键(Hash Key)从静态分配的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。源地址散列(Source Hashing)
“源地址散列”调度算法根据请求的源IP地址,作为散列键(Hash Key)从静态分类的散列表找出对应的服务器,若该服务器是可用的且未超载,将请求发送到该服务器,否则返回空。
3.2 内核Layer-7交换机KTCPVS
在基于IP负载的调度技术中,无论请求发送到哪一台服务器,返回内容都是一样的。
有些应用中后段服务功能不一,有的提供HTML文档,有的提供图片,有的提供CGI,这就需要基于内容的调度(Content-Based Scheduling)。
Linux操作系统内核中,实现了Layer-7交换,叫做KTCPVS (Kernel TCP Virtual Server)。它能够对HTTP请求做基于内容的调度。但是还不成熟。
应用层交换比较复杂,但是有以下好处:
- 相同页面的请求被发送到同一服务器,可以提高单台服务器的Cache命中率。
- 一些研究表明WEB访问流中存在局部性。Layer-7交换可以充分利用访问的局部性,将相同类型的请求发送到同一台服务器,使得每台服务器收到的请求具有更好的相似性,可进一步提高单台服务器的Cache命中率。
- 后端服务器可运行不同类型的服务,如文档服务,图片服务,CGI服务和数据库服务等。
4. LVS集群的特点
4.1 功能
- 有实现三种IP负载均衡技术和八种连接调度算法的IPVS软件。
- 在IPVS内部实现上,采用了高效的Hash函数和垃圾回收机制,能正确处理所调度报文相 关的ICMP消息(有些商品化的系统反而不能)。
- 虚拟服务的设置数目没有限制,每个虚拟服务有自己的服务器集。
- 它支持持久的虚拟服务(如HTTP Cookie和HTTPS等需要该功能的支持),并提供详尽的统计数据,如连接的处理速率和报文的流量等。
- 针对大规模拒绝服务(Deny of Service)攻击,实现了三种防卫策略。
- 有基于内容请求分发的应用层交换软件KTCPVS,它也是在Linux内核中实现。
- 有相关的集群管理软件对资源进行监测,能及时将故障屏蔽,实现系统的高可用性。
- 主、从调度器能周期性地进行状态同步,从而实现更高的可用性。
4.2 适用性
后端服务器可运行任何支持TCP/IP的操作系统,包括Linux,各种Unix(如FreeBSD、Sun Solaris、HP Unix等),Mac/OS和Windows NT/2000等。
负载调度器能够支持绝大多数的TCP和UDP协议:
协议 | 内容 |
---|---|
TCP | HTTP,FTP,PROXY,SMTP,POP3,IMAP4,DNS,LDAP,HTTPS,SSMTP等 |
UDP | DNS,NTP,ICP,视频、音频流播放协议等 |
4.3 性能
- LVS服务器集群系统具有良好的伸缩性,可支持几百万个并发连接。
- 配置100M网卡,采用VS/TUN或VS/DR调度技术,集群系统的吞吐量可高达1Gbits/s;
- 如配置千兆网卡,则系统的最大吞吐量可接近10Gbits/s。
4.4 可靠性
4.5 软件许可证
LVS集群软件是按GPL(GNU Public License)许可证发行的自由软件,这意味着你可以得到软件的源代码,有权对其进行修改,但必须保证你的修改也是以GPL方式发行。