CAP理论
为什么需要CAP理论
开发分布式系统时,我们需要根据业务特点,设计合适的分区容错一致性模型,以实现集群能力。这个问题的棘手点在于:当系统发生分区错误时,应该如何保障系统稳定运行,不影响业务。而CAP理论可以解决这个问题。
CAP理论是一个很好的思考框架,它对分布式系统的特性做了高度抽象,将其抽象成一致性、可用性和分区容错性,并对特性之间的冲突做了总结,即CAP不可能三角。一旦掌握它,我们就能根据业务特点,自然而然地设计出合适的分区容错一致性模型。
什么是CAP理论
概念
在一个分布式系统(互相连接并共享数据的节点的集合)中,当涉及读写操作时,只能保证
一致性、可用性和分区容错性中的两个,另一个必须被牺牲。
适用场景
CAP理论探讨的是
节点互联和共享数据的分布式系统。如果分布式系统的节点没有互联,或没有共享数据,那就不是CAP理论讨论的范围。不过,这个条件是天然满足的。毕竟,节点互联和共享数据的分布式系统才会有数据一致性问题。
CAP理论探讨的是数据的读写操作,不是分布式系统的所有功能。也就是,CAP理论针对的是数据,不是整个系统。因为一个系统可能有多份数据。
CAP三个指标
CAP 理论对分布式系统的特性做了高度抽象,形成了三个指标:
- 一致性:对客户端的每次读取操作,不管访问的是哪个节点,返回的都是同一份最新的数据,否则读取失败。一致性强调各节点间的数据一致。也就是说,在客户端看来,集群和单机在数据一致性上是一样的。
- 可用性:对客户端的任何请求,访问非故障节点时,都能返回合理的响应(不是错误或者超时),但不保证是同一份最新数据。可用性强调服务可用,但不保证数据的一致。
- 分区容错性:当出现网络分区[1]时,系统可以继续提供服务。网络分区可能是因为消息丢失,高延迟,连接中断等等。分区容错性强调系统对分区故障的容错性。
CAP不可能三角
CAP 不可能三角指,对于一个分布式系统来说,一致性、可用性和分区容错性三者不可兼得,只能选择其中两个。
如何使用CAP理论
- 分区容错性(P)必选。分布式系统一定有网络交互。只要有网络交互,就一定会出现消息丢失等网络故障。这种状况我们必须接受,还必须保证系统正常运行。
-
当发生网络分区时,要么选择一致性(C),保证数据的绝对一致;要么选择可用性(A),保证服务可用。
- 当选择了一致性(C)时,即采用CP模型,如果发生网络分区,集群拒绝客户端的写请求,因为服务法保证所有节点间的数据一致。
- 当选择了可用性(A)时,即采用AP模型,如果发生网络分区,集群仍然接受客户端的读、写请求,但是节点返回的可能不是最新的数据。
- 不存在网络分区的情况下,即系统正常运行的情况下,一致性(C) 和可用性( A) 要能够同时保证。
实战
如何为系统设计分区容错一致性模型?
- CAP理论针对的是数据,而不是系统;一个系统有多种数据。所以,一个系统有多种分区容错一致性模型。
- 分区容错性(P)必选。在发生分区故障时,系统必须还能正常运行。
- 当发生网络分区,选择一致性还是可用性,取决于:数据不一致对系统有没有影响?我们能容忍这种影响吗?如果可以,选择可用性,否则一致性。
-
网络分区指的是网络故障将整个网络分为多个子网络,子网络间不互通,但是子网络内的节点间是互通的。 ↩