分布式系统领域是计算机科学中十分重要的一个技术领域. 但它并不完美, 我们需要解决几个常见而又核心的问题. 分布式系统才能发挥它的巨大价值.
目录:
一致性
共识算法
FLP 不可能性原理
CAP 原理
ACID 原则
一, 一致性问题
概念:
一致性指对于系统中的多个服务节点,给定一系列操作,在协议(e.g.某种共识算法)保障下,试图使得它们对处理结果达成某种程度的一致.
为什么要达到一致?
只有分布式系统实现了“一致”,对外才可以呈现为一个功能正常的,且性能和稳定性都要好很多的“虚处理节点”。
理想状态下的一致性有什么特点?
1.可终止性: 一致的结果在有限时间内能完成;
2.共识性: 不同节点最终完成决策的结果应该相同;
3.合法性: 决策的结果必须是其它进程提出的提案;
现实:
可在实际的计算机网络中,由于"节点间通讯需要时间", "节点间网络通讯不可靠(延迟和故障)", "节点的处理方法错误"等多种原因,完美实现一致性(强一致性)是非常困难的.而且即便达到了,成本也非常大. 所以一般都会衡量其中利弊,选择自己最需要的,进行取舍.
我们定下一个时间,这个时间一般都不是立刻,而是有个时间范围,比如10ms, 只要系统在这个我们约定的时间内,系统能达到一致的状态,就算是一致性(弱一致性).
二.共识算法
共识算法是为了 "保障系统满足不同程度的一致性" 而用到的一种算法.
e.g. 有100个人分别在全国各地(相当于100个网络节点). 现在出现一个提议--一起去北京看升国旗, 我们需要依靠"共识算法",保证最后大家能达成一致意见--去还是不去.
难点:
如果这100个人都在线,都能立刻响应,那么根据之前定下的协议快速达到一致意见并不难. 但实际中,可能这100个人有些人在睡觉在洗澡(节点故障,宕机,响应延时、网络中断、节点故障、存在恶意节点故意要破坏系统)
常见算法:
PBFT(实用拜占庭容错算法)系列
PoW(工作量证明)系列
三.FLP 不可能性原理
众多的节点之间通信,必然存在网络自身不可靠的原因、主机故障原因、恶意操控等原因,因此无法保证实现完全的共识.
由Fischer、Lynch和Patterson三位科学家于1985年发表的论文《Impossibility of Distributed Consensus with One Faulty Process》指出:在异步模型中,分布式系统中只要有一个进程不可用(失去响应或暂停),就可能无法达成整体的共识.
于是出了FLP原理: 在网络可靠的前提下,任意节点失效,一个或者多个的最小化异步模型系统中,不可能存在一个解决一致性问题的确定性算法。
四,CAP 原理
那既然flp不可能原理表明有可能无法达成共识, 那共识算法还有没有意义呢?
接下来我们来认识一下: CAP 原理.
概念:
CAP 原理:分布式计算系统不可能同时确保以下三个特性: 致性、可用性和分区容忍性,设计中往往需要弱化对某个特性的保证.
当网络可能出现分区的时候,系统是无法同时保证 致性和可用性的..要么,节点收到请求后因为没有得到其他节点的确认而不应答(牺牲可用性),要么节点只能应答非一致的结果(牺牲一致性).
五. ACID 原则
ACID 原则指的是:
Atomicity (原子性)Consistency (一致性)Isolation (隔离性)Durability (持久性)用了四种特性的缩写.
ACID 特征如下:
Atomicity :每次操作是原子的,要么成功,要么不执行;
Consistency :数据库的状态是一致的,无中间状态;
Isolation :各种操作彼此之间互相不影响;
Durability :状态的改变是持久的,不会失效;