事务隔离级别
● 脏读(Dirty reads)——脏读发生在一个事务读取了另一个事务改写但尚未提交的数据时。如果改写在稍后被回滚了,那么第一个事务获取的数据就是无效的。
● 不可重复读(Nonrepeatable read)——不可重复读发生在一个事务执行相同的查询两次或两次以上,但是每次都得到不同的数据时。这通常是因为另一个并发事务在两次查询期间进行了更新。
● 幻读(Phantom read)——幻读与不可重复读类似。它发生在一个事务(T1)读取了几行数据,接着另一个并发事务(T2)插入了一些数据时。在随后的查询中,第一个事务(T1)就会发现多了一些原本不存在的记录。
接下来是不同的隔离级别,显然隔离级别越低数据库的读写效率越高,但同时出现异常的可能性越大。在最高隔离级别下,完全不会出现异常,但是在高并发事务下数据库的性能将急剧下降。
可读取未提交的事务(read uncommitted): 这种情况下脏读,不可重复读和幻读均可能出现
可读取已经提交的事务(read committed):可能出现不可重复读和幻读
可重复读取(repeatable read):可能出现幻读
串行化(serializable):事务串行执行,以上问题均不会出现
cap理论
c-> consistency:一致性,指的是在任意时刻访问分布式系统的任意节点都将返回相同的数据
a->availability:可用性,指的是对于用户的请求总是能够在有限的时间内返回结果
p->partion:分区容错性,指的是分布式系统内部节点之间由于网络问题无法通信但仍旧能够提供一致性和可用性的服务
一个分布式系统最多只能满足以上两个特性,考虑到网络问题无可避免,因此通常我们会在一致性和可用性之间进行选择。其中BASE理论(basic available, soft state, eventrually consistent)就是在二者之间做平衡。
基本可用:分布式系统可能会有响应时间的损耗,但最终会返回结果,在高并发下返回结构可被降级处理。
软状态:分布式系统节点之间进行数据复制时存在延时
最终一致性:分布式系统各节点的数据总会在一段时间后完全一致。
两阶段提交
两阶段提交是把分布式事务分为两个阶段进行处理
阶段一:发起事务请求,这一阶段事务协调者向各个参与者发出执行事务的请求,收到请求的参与者执行事务,成功则向协调者反馈yes,失败则反馈no
阶段二:执行事务提交,但协调者收到所有参与者的yes反馈后将向参与者发出事务提交的请求,参与者收到后执行事务提交并反馈ACK给协调者,协调者收到所有参与者的ACK后事务完成
事务中断:发生中断的情况包括阶段一存在参与者反馈no,或者协调者在超时之后仍未收到所有参与者的反馈
两阶段提交是一个强一致性的分布式事务解决方案,存在以下优缺点
优点:简单,实现方便
缺点:同步阻塞(参与者需要等待其他参与者一起完成事务),单点问题(协调者只有一个),脑裂(阶段二中出现网络问题,可能部分参与者未接收到协调者的请求导致不同参与者最终数据不一致),通过超时机制来判断是否需要进行事务中断很保守缺乏更完善的容错机制。
三阶段提交
三阶段提交时两阶段提交的改进版
阶段一:能不能搞,协调者向参与者发起询问是否能执行事务提交操作,参与者根据自身情况反馈yes或者no
阶段二:预提交,如果阶段一都是yes反馈,协调者将告知所有参与者进行事预提交,收到请求的参与者执行事务并反馈ack给协调者,等待协调者给出commit或者abort命令
如果阶段一存在no反馈,协调者向所有参与者发出abort请求进行事务中断
阶段三:如果协调者收到了所有参与者的ACK响应那么将发送commit命令给所有参与者进行事务提交,参与者完成事务提交后向协调者发送ACK,协调者收到所有参与者的ACK后完成事务,如果协调者未在超时时间内等到所有参与者的响应那么将发出abort请求到参与者进行事务中断。
WARNING:阶段三中如果协调者和参与者之间发生网络问题,导致参与者收不到协调者的commit或者abort命令时,等待超时后参与者将提交自己的事务。
优缺点:协调者单点故障后仍然能够提交事务,也可能造成数据不一致的问题
事务补偿
分布式事务由于网络等问题可能出现数据不一致的情况,这时候需要系统通过其他方式进行事务补偿达到数据的最终一致性。可在事务开始时事务相关数据写入数据库,通过worker定时去检测数据库中这些事务是否已经完成,如果没有完成则进行补偿,补偿的方式可以是消息通知。