CAP理论概述
一个分布式系统最多只能同时满足 一致性(Consistency)、可用性(Availability)和分区容错性(Partition tolerance)这三项中的两项。
Consistency 一致性
一致性指 “all nodes see the same data at the same time”,即更新操作成功并返回客户端完成后,所有节点在同一时间的数据完全一致。
Availability 可用性
可用性指 “Reads and writes always succeed”,即服务一直可用,而且是正常响应时间。
Partition tolerance 分区容错性
分区容错性指 “the system continues to operate despite arbitrary message loss or failure of part of the system”,即分布式系统在遇到某节点或网络分区故障的时候,仍然能够对外提供满足一致性和可用性的服务。
好的分区容错性要求能够使应用虽然是一个分布式系统,而看上去却好像是在一个可以运转正常的整体。比如现在的分布式系统中有某一个或者几个机器宕掉了,其他剩下的机器还能够正常运转满足系统需求,或者是机器之间有网络异常,将分布式系统分隔为独立的几个部分,各个部分还能维持分布式系统的运作,这样就具有好的分区容错性。
在分布式系统中,通常是无法放弃 Partition Tolerance 的,也就只能在 CP 和 AP 之间做选择了。如果有个分布式系统号称是 CA 的,那一定是扯淡。
示例
假设我们用一台服务器 A 和 B 对外提供存储服务。每次用户在往服务器 A 写入数据的时候,A 都往服务器 B上写一份,然后再返回客户端。用户的每份数据都存了两份,分别在 A 和 B 上,用户访问任意一台机器都能读取到最新的数据。
假设 A 和 B 之间的网络断了导致 A 和 B 无法通信,也就是说网络出现了分区,那么用户在往服务器 A 写入数据的时候,服务器 A 无法将该数据写入到服务器 B。这时,服务器 A 就必须要做出一个艰难的选择:
- 要么选择一致性(C)而牺牲可用性(A):为了保证服务器 A 和 B 上的数据是一致的,服务器 A 决定暂停对外提供数据写入服务,从而保证了服务器A和B上的数据是一致。
- 要么选择可用性(A)而牺牲一致性(C):为了保证服务不中断,服务器 A 先把数据写入到了本地,然后返回客户端,从而让客户端感觉数据已经写入了。
对网络分区的处理
对网络分区的处理有以下几个步骤:
- 检测网络是否出现分区
- 当分区出现了,进入分区模式并限制某些操作
-
当网络恢复后,启动分区恢复
一致性模式
弱一致性
在写入之后,访问可能看到,也可能看不到(写入数据)。尽力优化之让其能访问最新数据。
这种方式可以 memcached 等系统中看到。弱一致性在 VoIP,视频聊天和实时多人游戏等真实用例中表现不错。打个比方,如果你在通话中丢失信号几秒钟时间,当重新连接时你是听不到这几秒钟所说的话的。
最终一致性
在写入后,访问最终能看到写入数据(通常在数毫秒内)。数据被异步复制。
DNS 和 Email 等系统使用的是此种方式。最终一致性在高可用性系统中效果不错。
强一致性
在写入后,访问立即可见。数据被同步复制。
文件系统和关系型数据库(RDBMS)中使用的是此种方式。强一致性在需要记录的系统中运作良好。
引用: