一、ACID
事务(Transaction):是由一系列对系统中数据进行访问与更新操作组成的一个程序执行逻辑单元,狭义上的事务特指数据库事务。
事务具有四个特征:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)和持久性(Durability),简称为事务的ACID原则。
- 原子性:事务必须是一个原子的操作序列单元,事务中包含的各项操作在一次执行过程中只允许出现:全部成功或 全部不执行;
- 一致性:事务的执行不能破坏数据库的完整性和一致性,一个事务在执行之前和执行之后,数据库都必须处于一致的状态,也就是:事务执行的结果必须使数据库从一个一致性状态变到另一个一致性状态。
- 隔离性:事务在并发环境中并发的事务是相互隔离的,一个事务的执行不能被其他事务干扰。一个事务内部的操作及使用的数据对其他并发事务是隔离的,并发执行的各个事务之间不能互相干扰。
在标准SQL规范中定义了四个事务隔离级别
- 未授权读取:也称读未提交,允许脏读,隔离级别最低。若一个事务正在处理某一数据,对其进行了更新,但还未提交事务,此时允许另一个事务能够访问该数据。
- 授权读取:也称读已提交,允许不可重复读取。若一个事务正在处理某一数据,此时另一个事务只能访问该事务被提交的数据。
- 可重复读:保证在事务处理过程中,多次读取同一个数据,其值都和事务开始时刻是一致的。可重复读禁止了不可重复读和脏读,但是可能出现幻读,指同样的事务操作,在前后两个时间内执行对同一数据项的读取可能出现不一致的结果。
- 串行化:事务只能一个接一个的处理,不能并发执行。
隔离级别 | 脏读(Dirty Read) | 不可重复读(NonRepeatable Read) | 幻读(Phantom Read) |
---|---|---|---|
未提交读(Read uncommitted) | 可能 | 可能 | 可能 |
已提交读(Read committed) | 不可能 | 可能 | 可能 |
可重复读(Repeatable read) | 不可能 | 不可能 | 可能 |
可串行化(Serializable ) | 不可能 | 不可能 | 不可能 |
- 持久性:一个事务一旦提交,他对数据库中对应数据的状态变更就是永久的。
二、分布式事务
分布式事务是指事务的参与者、支持事务的服务器、资源服务器以及事务管理器分别位于分布式系统的不同节点之上。
2.1、CAP定理
CAP理论:一个分布式系统不可能同时满足一致性(C:Consistency)、可用性(A:Availability)和容错性(P:Partition tolerance)这三个基本需求,最多只能满足其中两个。
- 一致性:在分布式环境中,一致性是指数据在多个副本之间是否能够保持一致的特性。
- 可用性:指系统提供的服务必须一直处于可用的状态,对于用户的每一个请求总是能在有限的时间内返回结果。
-
分区容错性:分区容错性约束了分布式系统具有:分布式系统在遇到任何网络分区故障的时候,仍然需要能够保证对外提供满足一致性和可用的服务,除非是整个网络环境都发生了故障。
2.2、BASE理论
BASE是Basically Available(基本可用)、Soft state(软状态)和Eventually consistent(最终一致性)三个短语缩写。
Base 理论是对 CAP 中一致性和可用性权衡的结果,其来源于对大型互联网分布式实践的总结,是基于 CAP 定理逐步演化而来的。其核心思想是:既是无法做到强一致性(Strong consistency),但每个应用都可以根据自身的业务特点,采用适当的方式来使系统达到最终一致性(Eventual consistency)。
- 基本可用:指分布式系统出现不可预知的故障时,允许损失部分可用性:响应时间上的损失、功能上的损失。
- 弱状态:也称软状态,指允许系统中的数据存在中间状态,并认为中间状态不会影响系统的整体可用性,即数据在不同副本之间数据同步存在延迟。
- 最终一致性:指所有的副本经过一段时间的同步后,最终达到一个一致的状态。最终一致性的本质是需要系统保证最终数据能够达到一致,而不需要实时保证系统数据的强一致性。
最终一致性存在以下几种:
- 因果一致性:若进程A更新完某个数据后通知了进程B,那么进程B之后对该数据的访问都应该能获得A更新之后的数据
- 读己之所写:指进程A更新了一个数据项后,他自己总能访问到更新过的最新值,不会访问到旧值。
- 会话一致性
- 单调读一致性
- 单调写一致性