CAP理论.md

CAP简介

1998年,加州大学的计算机科学家 Eric Brewer 提出,分布式系统有三个指标。

Consistency
Availability
Partition tolerance

image.png

Partition tolerance 分区容错

大多数分布式系统都分布在多个子网络。每个子网络就叫做一个区(partition)
Partition tolerance 分区容错,这里的分区是指网络意义上的分区。由于网络是不可靠的,所有节点之间很可能出现无法通讯的情况,在节点不能通信时,要保证系统可以继续正常服务。

以实际效果而言,分区相当于对通信的时限要求。系统如果不能在时限内达成数据一致性,就意味着发生了分区的情况,必须就当前操作在C和A之间做出选择

Consistency 一致性

数据在多个副本之间是否能够保持一致的特性。(当一个系统在一致状态下更新后,应保持系统中所有数据仍处于一致的状态)

Availability 可用性

系统提供的服务必须一直处于可用状态,对每一个操作的请求必须在有限时间内返回结果

CAP定理

一个分布式系统不可能同时满足一致性、可用性和分区容错性这三个需求,只能最多满足两个。

CAP既适用于NoSQL数据库,也适合关系数据库,它是NoSQL数据库、关系数据库、乃至一切分布式系统在设计数据多个副本之间读写一致问题时需要遵循的共同原则。

  • 在保证C和P的情况下
    为了保证数据一致性,data1需要将数据复制给data2,即data1和data2需要进行通信。但是由于网络是不可靠的,我们系统有保证了分区容忍性,也就是说这个系统是可以容忍网络的不可靠的。这时候data2就不一定能及时的收到data1的数据复制消息,当有请求向data2访问number数据时,为了保证数据的一致性,data2只能阻塞等待数据真正同步完成后再返回,这时候就没办法保证高可用性了。
    所以,在保证C和P的情况下,是无法同时保证A的。

  • 在保证A和P的情况下
    为了保证高可用性,data1和data2都有在有限时间内返回。同样由于网络的不可靠,在有限时间内,data2有可能还没收到data1发来的数据更新消息,这时候返回给客户端的可能是旧的数据,和访问data1的数据是不一致的,也就是违法了C。
    也就是说,在保证A和P的情况下,是无法同时保证C的。

  • 在保证A和C的情况下
    如果要保证高可用和一致性,只有在网络情况良好且可靠的情况下才能实现。这样data1才能立即将更新消息发送给data2。但是我们都知道网络是不可靠的,是会存在丢包的情况的。所以要满足即时可靠更新,只有将data1和data2放到一个区内才可以,也就丧失了P这个保证。其实这时候整个系统也不能算是一个分布式系统了。

参考:
CAP 定理的含义
浅谈CAP的理解
CAP原理详解

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容