2PC,Two-Phase Commit,是一种保证分布式架构下的所有节点处理事务的原子性和一致性的算法。通常被认为是一种一致性协议。利用该协议能够很方便的协调分布式事务的参与节点,以及统一决定事务的提交和回滚。
对于分布式的每个节点来说,它能够明确的知道自己执行事务的成败,但却无法直接获得其他节点的执行结果。因此,作为调度节点的行为和作出事务提交决定的“协调者(Coordinator)”被引入,与之相对的参与事务的节点被称为“参与者(Participant)”。
二阶段提交,顾名思义,将事务的提交过程分为两个阶段:
阶段一. 提交事务请求(投票阶段):
1. 事务询问。协调者向所有的参与者发送事务内容,然后等待各参与者的响应。
2. 执行事务。参与者执行事务,并记录Undo和Redo到日志中。这期间参与者会申请并占用与事务相关的资源。
3. 参与者响应。执行事务成功的参与者向协调者返回yes,否则返回no。
阶段二. 执行事务提交(执行阶段):
协调者根据参与者的反馈情况决定是否进行事务提交。
如果所有的参与者都返回yes, 则进行执行事务提交的操作过程:
1. 发送提交请求。协调者向所有的参与者发送提交事务的请求。
2. 事务提交。参与者正式提交事务,完成后释放资源。
3. 反馈提交结果。参与者向协调者发送ack。
4. 完成事务。协调者收到所有的ack后,事务完成。
如果有的参与者在第一阶段返回了no,则进行中断事务的操作过程:
1. 发送回滚请求。协调者向所有的参与者发送事务回滚请求。
2. 事务回滚。参与者收到回滚请求后,利用Undo信息回滚,结束后释放资源。
3. 反馈回滚结果。参与者向协调者发送ack。
4. 中断事务。协调者收到所有的ack后,事务中断。
二阶段提交中,每个事务都是先尝试后提交,保证强一致性。
二阶段提交的优点是原理简单,实现方便,缺点有以下几个:
1. 同步阻塞:这是最明显也是最大的问题。在两个阶段,所有参与事务的逻辑都处于阻塞状态。(同步:有时序关系,一件事情的完成依赖于另一件事情先完成;阻塞:等待响应后才能继续向下执行)
2. 单点:协调者为单点,一旦出问题,整个流程无法运转。如果协调者在阶段二发生了问题,所有的参与者会一直锁定事务资源,无法完成事务操作。
3. 数据不一致(脑裂):若阶段二中某些参与者没收到commit请求,则只有收到的参与者会提交事务。
4. 太过保守:若协调者始终无法得到所有参与者的响应信息,则只能依据超时机制判断是否需要中断事务,没有较完善的容错机制。