负载平衡(英语:load balancing)是一种电子计算机技术,用来在多个计算机(计算机集群)、网络连接、CPU、磁盘驱动器或其他资源中分配负载,以达到优化资源使用、最大化吞吐率、最小化响应时间、同时避免过载的目的。 使用带有负载平衡的多个服务器组件,取代单一的组件,可以通过冗余提高可靠性。负载平衡服务通常是由专用软件和硬件来完成。 主要作用是将大量作业合理地分摊到多个操作单元上进行执行,用于解决互联网架构中的高并发和高可用的问题。
这是[维基百科](负载均衡 - 维基百科,自由的百科全书)对负载均衡的定义。
按照我的理解,负载均衡主要就是为了两个目的:并行处理(A忙不过来,B一起上)、防止单点失败(A忙废了,B顶上)。分别对应了高并发、高可用的核心诉求。
负载均衡的算法有很多种,我尝试把我的理解表达出来。
陆游老先生曾经曰过:纸上得来终觉浅,绝知此事要躬行。所以,用C++把它们实现一下。
1. 轮询 Round Robin
轮询,就是将请求逐个分发给后端的服务器,每个服务器都被平等对待。
具体实现,就是把所有的后端服务器放到一个数组里,并用一个变量来保存当前索引。每次过来一个新的请求,把当前索引前进一步,并对数组长度取模。
参考代码如下:
// Load Balance with Round Robin
#pragma once
#include <vector>
#include <string>
#include <unordered_map>
#include <iostream>
class LoadBalanceRoundRobin
{
public:
LoadBalanceRoundRobin()
{
current = -1;
}
~LoadBalanceRoundRobin()
{
}
bool AddServer(const std::string& srv)
{
servers.push_back(srv);
return true;
}
// Simulate a new request
bool NextRequest()
{
if(servers.empty())
{
std::cout << "Please add servers first. " << std::endl;
return false;
}
// Move to next server
current = (current + 1) % servers.size();
// Update stats
stats[servers[current]]++;
return true;
}
void PrintStats() const
{
std::cout << "Server Hit stats with round robin: ";
for(auto x : stats)
{
std::cout << std::endl;
std::cout << x.first << ": " << x.second;
}
std::cout << std::endl;
}
private:
// The servers to be balanced
std::vector<std::string> servers;
// Index of server hit
int current;
// Stats, key is the server, value is the hit count
std::unordered_map<std::string, int> stats;
};
往这个LB添加5个服务器,然后发起一百万次请求:
void TestRoundRobin()
{
LoadBalanceRoundRobin lb;
lb.AddServer("192.168.1.10");
lb.AddServer("192.168.1.11");
lb.AddServer("192.168.1.12");
lb.AddServer("192.168.1.13");
lb.AddServer("192.168.1.14");
for(int i = 0; i < 1000000; i++)
{
lb.NextRequest();
}
lb.PrintStats();
}
可以看到,这些请求被均匀的分发给了每个服务器:
Server Hit stats with round robin:
192.168.1.14: 200000
192.168.1.13: 200000
192.168.1.12: 200000
192.168.1.11: 200000
192.168.1.10: 200000
<u>Note一下,本次内容重点在于试验负载均衡算法,不在于类的设计。所以,后面还会出现好几个相似的类,但我并没有去做任何的继承。实际工程应用的时候,需要考虑抽象、继承问题,以减少代码重复。</u>
2. 加权轮询 Weighted Round Robin
后端的服务器,有些强劲、有些比较弱。可以给强劲的服务器分配较大的权重,给它分发更多的请求。
具体实现跟前面的轮询很像。主要的差别在于,添加后端服务器时,根据权重的数值N,把对应的服务器添加N次到数组里面,这样使得该服务器被轮询到的次数比例,跟它的权重比例一样。
参考代码如下:
// Load Balance with Weighted Round Robin
#pragma once
#include <vector>
#include <string>
#include <unordered_map>
#include <iostream>
#include <algorithm>
class LoadBalanceWeightedRoundRobin
{
public:
LoadBalanceWeightedRoundRobin()
{
current = -1;
}
~LoadBalanceWeightedRoundRobin()
{
}
bool AddServer(const std::string& srv, int weight)
{
if(weight < 1)
{
std::cout << "Weight should be equal or greater than 1." << std::endl;
return false;
}
for(int i = 0; i < weight; i++)
{
// Add weight times to vector
servers.push_back(srv);
}
// Shuffle the vector so that servers will be out of order
std::random_shuffle(servers.begin(), servers.end());
return true;
}
// Simulate a new request
bool NextRequest()
{
if(servers.empty())
{
std::cout << "Please add servers first. " << std::endl;
return false;
}
// Move to next server
current = (current + 1) % servers.size();
// Update stats
stats[servers[current]]++;
return true;
}
void PrintStats() const
{
std::cout << "Server Hit stats with weighted round robin: ";
for(auto x : stats)
{
std::cout << std::endl;
std::cout << x.first << ": " << x.second;
}
std::cout << std::endl;
}
private:
// The servers to be balanced
std::vector<std::string> servers;
// Index of server hit
int current;
// Stats, key is the server, value is the hit count
std::unordered_map<std::string, int> stats;
};
往这个LB添加5个服务器,并给与不同的权重,然后发起一百万次请求:
void TestWeightedRoundRobin()
{
LoadBalanceWeightedRoundRobin lb;
lb.AddServer("192.168.1.10", 1);
lb.AddServer("192.168.1.11", 2);
lb.AddServer("192.168.1.12", 3);
lb.AddServer("192.168.1.13", 4);
lb.AddServer("192.168.1.14", 10);
for(int i = 0; i < 1000000; i++)
{
lb.NextRequest();
}
lb.PrintStats();
}
可以看到,每个服务器被分发的请求比例,跟它的权重比例是一样的:
Server Hit stats with weighted round robin:
192.168.1.13: 200000
192.168.1.10: 50000
192.168.1.12: 150000
192.168.1.11: 100000
192.168.1.14: 500000
3. 随机 Random
随机算法也很好理解,每次过来一个请求,随机分发给某一台后端服务器即可。随着请求量的增加,每个后端服务器的请求总数会趋向一致。
参考代码如下:
// Load Balance with Random
#pragma once
#include <vector>
#include <string>
#include <unordered_map>
#include <iostream>
class LoadBalanceRandom
{
public:
LoadBalanceRandom()
{
}
~LoadBalanceRandom()
{
}
bool AddServer(const std::string& srv)
{
servers.push_back(srv);
return true;
}
// Simulate a new request
bool NextRequest()
{
if(servers.empty())
{
std::cout << "Please add servers first. " << std::endl;
return false;
}
// Pickup a random server
int current = rand() % servers.size();
// Update stats
stats[servers[current]]++;
return true;
}
void PrintStats() const
{
std::cout << "Server Hit stats with random: ";
for(auto x : stats)
{
std::cout << std::endl;
std::cout << x.first << ": " << x.second;
}
std::cout << std::endl;
}
private:
// The servers to be balanced
std::vector<std::string> servers;
// Stats, key is the server, value is the hit count
std::unordered_map<std::string, int> stats;
};
往这个LB添加5个服务器,然后发起一百万次请求:
void TestRandom()
{
LoadBalanceRandom lb;
lb.AddServer("192.168.1.10");
lb.AddServer("192.168.1.11");
lb.AddServer("192.168.1.12");
lb.AddServer("192.168.1.13");
lb.AddServer("192.168.1.14");
for(int i = 0; i < 1000000; i++)
{
lb.NextRequest();
}
lb.PrintStats();
}
可以看到,这些请求基本上被均匀的分发给了每个服务器:
Server Hit stats with random:
192.168.1.13: 200448
192.168.1.10: 199584
192.168.1.14: 199799
192.168.1.11: 199495
192.168.1.12: 200674
4. 加权随机 Weighted Random
加权随机与加权轮询的思路类似,给强劲的后端服务器更大的权重(出现次数更多),让它更容易被随机选中。
具体代码跟随机相比,差别只是在添加后端服务器时,根据它的权重值,添加对应的次数而已:
// Load Balance with Weight Random
#pragma once
#include <vector>
#include <string>
#include <unordered_map>
#include <iostream>
#include <algorithm>
class LoadBalanceWeightedRandom
{
public:
LoadBalanceWeightedRandom()
{
}
~LoadBalanceWeightedRandom()
{
}
bool AddServer(const std::string& srv, int weight)
{
if(weight < 1)
{
std::cout << "Weight should be equal or greater than 1." << std::endl;
return false;
}
for(int i = 0; i < weight; i++)
{
// Add weight times to vector
servers.push_back(srv);
}
return true;
}
// Simulate a new request
bool NextRequest()
{
if(servers.empty())
{
std::cout << "Please add servers first. " << std::endl;
return false;
}
// Pickup a random server
int current = rand() % servers.size();
// Update stats
stats[servers[current]]++;
return true;
}
void PrintStats() const
{
std::cout << "Server Hit stats with weighted random: ";
for(auto x : stats)
{
std::cout << std::endl;
std::cout << x.first << ": " << x.second;
}
std::cout << std::endl;
}
private:
// The servers to be balanced
std::vector<std::string> servers;
// Stats, key is the server, value is the hit count
std::unordered_map<std::string, int> stats;
};
往这个LB添加5个服务器,并给与不同的权重,然后发起一百万次请求:
void TestWeightedRandom()
{
LoadBalanceWeightedRandom lb;
lb.AddServer("192.168.1.10", 1);
lb.AddServer("192.168.1.11", 2);
lb.AddServer("192.168.1.12", 3);
lb.AddServer("192.168.1.13", 4);
lb.AddServer("192.168.1.14", 10);
for(int i = 0; i < 1000000; i++)
{
lb.NextRequest();
}
lb.PrintStats();
}
可以看到,每个服务器被分发的请求比例,跟它的权重比例是基本一样的:
Server Hit stats with weighted random:
192.168.1.13: 200290
192.168.1.12: 149612
192.168.1.11: 100060
192.168.1.10: 50291
192.168.1.14: 499747
5. 源地址哈希 Source IP Hash
根据客户端的IP地址,通过Hash算出个数值后,对后端服务器的总数取模,然后把请求分发给取模得到的服务器。
这个代码也很简单,就不实现了。
前面的这五种算法,在选择分发到哪个服务器时,都依赖于服务器的总数。
而服务器总会有挂掉的时候。一旦某个服务器挂了,意味着可用的服务器总数发生了变化(虽然前面的例子,都没有实现RemoveServer的接口),那么被选中的服务器都会发生变化。
这就带来了不一致的问题、每个请求都要重新计算。所以,后面的一致性哈希算法应运而生了。
题外话,技术也好、算法也好,都是为了解决某些具体的问题、场景而被发明出来的。
理解了问题,有助于更好的理解为什么会有这样的算法、解决方案。
6. 一致性哈希 Consistent Hashing
一致性哈希是现在用的比较广泛的算法,具体就不解释了,网上资料非常多。[维基百科](一致哈希 - 维基百科,自由的百科全书)的描述也很清楚:
一致哈希将每个对象映射到圆环边上的一个点,系统再将可用的节点机器映射到圆环的不同位置。查找某个对象对应的机器时,需要用一致哈希算法计算得到对象对应圆环边上位置,沿着圆环边上查找直到遇到某个节点机器,这台机器即为对象应该保存的位置。 当删除一台节点机器时,这台机器上保存的所有对象都要移动到下一台机器。添加一台机器到圆环边上某个点时,这个点的下一台机器需要将这个节点前对应的对象移动到新机器上。 更改对象在节点机器上的分布可以通过调整节点机器的位置来实现。
参考代码如下:
// Load Balance with Consistent Hashing
#pragma once
#include <vector>
#include <string>
#include <sstream>
#include <map>
#include <unordered_map>
#include <iostream>
class LoadBalanceConsistentHashing
{
public:
LoadBalanceConsistentHashing(int vNum = 32)
{
virtualNum = vNum;
}
~LoadBalanceConsistentHashing()
{
}
bool AddServer(const std::string& srv)
{
servers.push_back(srv);
// Insert virtual nodes for each real server
for(int i = 0; i < virtualNum; i++)
{
// Compose name like: 192.168.1.10#1
std::stringstream srvName;
srvName << srv << "#" << i;
unsigned int hashKey = std::hash<std::string>{}(srvName.str());
nodes.insert({hashKey, srv});
}
return true;
}
bool DeleteServer(const std::string& srv)
{
auto server = std::find(servers.begin(), servers.end(), srv);
if(server == servers.end())
{
std::cout << "Invalid server to delete. " << std::endl;
return false;
}
// Delete from real servers
servers.erase(server);
// Delete virtual nodes for this real server
for(int i = 0; i < virtualNum; i++)
{
// Compose name like: 192.168.1.10#1
std::stringstream srvName;
srvName << srv << "#" << i;
unsigned int hashKey = std::hash<std::string>{}(srvName.str());
// Find and delete
auto it = nodes.find(hashKey);
if(it != nodes.end())
{
nodes.erase(it);
}
}
return true;
}
// Simulate a new request
bool NextRequest()
{
if(servers.empty())
{
std::cout << "Please add servers first. " << std::endl;
return false;
}
// Find the node for this request
int val = rand();
unsigned int hashKey = std::hash<std::string>{}(std::to_string(val));
auto node = nodes.lower_bound(hashKey);
if(node == nodes.end())
{
// Use the first node if not found
node = nodes.begin();
}
// Update stats
stats[node->second]++;
return true;
}
void ResetStats()
{
stats.clear();
}
void PrintStats() const
{
std::cout << "Server Hit stats with Consistent Hashing: ";
for(auto x : stats)
{
std::cout << std::endl;
std::cout << x.first << ": " << x.second;
}
std::cout << std::endl;
}
private:
// Virtual nodes number for each real server
int virtualNum;
// The real servers
std::vector<std::string> servers;
// The virtual servers. Key is hash, value is the real server
std::map<unsigned int, std::string> nodes;
// Stats, key is the real server, value is the hit count
std::unordered_map<std::string, int> stats;
};
往这个LB添加5个服务器,每个服务器默认的虚拟节点数为32个,然后发起一百万次请求:
LoadBalanceConsistentHashing lb;
lb.AddServer("192.168.1.10");
lb.AddServer("192.168.1.11");
lb.AddServer("192.168.1.12");
lb.AddServer("192.168.1.13");
lb.AddServer("192.168.1.14");
for(int i = 0; i < 1000000; i++)
{
lb.NextRequest();
}
lb.PrintStats();
可以看到,每个服务器被分发的请求总数比较均匀:
Server Hit stats with Consistent Hashing:
192.168.1.13: 200693
192.168.1.14: 140848
192.168.1.11: 180680
192.168.1.12: 265031
192.168.1.10: 212748
我在代码里,用的是C++自带的哈希函数。如果使用别的哈希算法,比如Fowler-Noll-Vo,还能得到更加均匀的分布。
接下来,尝试把其中一个服务器删除,它附属的32个虚拟节点也会被删除。代码如下:
// Delete one server, and try again
lb.DeleteServer("192.168.1.12");
lb.ResetStats();
for(int i = 0; i < 1000000; i++)
{
lb.NextRequest();
}
lb.PrintStats();
得到的输出,依然比较均匀:
Server Hit stats with Consistent Hashing:
192.168.1.14: 205757
192.168.1.10: 292805
192.168.1.11: 241764
192.168.1.13: 259674
7. 最小连接数法 Least Connection
检测所有后端服务器中,连接数最少的一个,然后把请求分发给它。连接数少,可以认为它处理的快,那么能者多劳,再多处理一点。
这个需要去统计、获取后端服务器的连接数,然后才能判断。就不实现了。
文章中的代码,全部上传在GitHub,欢迎访问:GitHub - yuchuanwang/LoadBalance