分布式事务 | 2PC与3PC 详解

2023-12-18 05:44
文章标签 详解 分布式 事务 2pc 3pc

本文主要是介绍分布式事务 | 2PC与3PC 详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

分布式事务

2PC

2PC ,两阶段提交,将事务的提交过程分成资源准备和资源提交两个阶段,并且由事务协调者来协调所有事务参与者,如果准备阶段所有事务参与者都预留资源成功,则进行第二阶段的资源提交,否则事务协调者回滚资源。

1. 第一阶段:准备阶段

由事务协调者询问通知各个事务参与者,是否准备好了执行事务,具体流程图如下:

image-20231206005858493

  1. 协调者向所有参与者发送事务内容,询问是否可以提交事务,并等待答复。
  2. 各参与者执行本地事务操作,将undo和redo信息记入事务日志中(但不提交事务)。
  3. 如参与者执行成功,给协调者反馈同意,否则反馈中止,表示事务不可以执行。

2. 第二阶段:提交阶段

协调者收到各个参与者的准备消息后,根据反馈情况通知各个参与者commit提交或者rockback回滚。

2.1 事务提交:

当第一阶段所有参与者都反馈同意时,协调者发起正式提交事务的请求,当所有参与者都回复同意时,则意味着完成事务,具体流程如下:

  1. 协调者节点向所有参与者节点发出正式提交的commit请求。
  2. 收到协调者的commit请求后,参与者正式执行事务提交操作,并释放在整个事务期间内占用的资源。
  3. 参与者完成事务提交后,向协调者节点发送ACK消息。
  4. 协调者节点收到所有参与者节点反馈的ACK消息后,完成事务。

image-20231209133335513

2.2 事务回滚

如果任意一个参与者节点在第一阶段返回的消息为中止,或者协调者节点在第一阶段的询问超时之前无法获取所有参与者节点的响应消息时,那么这个事务将会回滚,具体流程如下:

image-20231209133626507

3. 2PC 缺点

二阶段提交确实能够提供原子性的操作,但二阶段提交还是有几个缺点:

  1. 性能问题:执行过程中,所有参与节点都是事务阻塞性的,当参与者占用公共资源时,其他第三方节点访问公共资源就不得不处于阻塞状态,为了数据一致性而牺牲了可用性,对性能影响比较大,不适合高并发高性能场景。
  2. 可靠性问题:2PC非常依赖协调者,当协调者发生故障时,尤其是第二阶段,那么所有参与者就会处于锁定事务资源的状态中,导致无法继续完成事务操作。如果是协调者挂掉了,可以重新选举一个协调者,但是无法解决因为协调者当即导致的参与者处于阻塞状态的问题。
  3. 数据一致性:当二阶段中的协调者向参与者发起了commit请求操作之后,发生了局部网络异常或者在发送commit请求过程中,协调者发生了故障,这会导致只有一部分参与者接受到了commit请求。 而在这部分参与者接受到commit请求之后就会执行commit操作。但是其他部分内接到commit请求的机器则无法执行事务操作。于是整个分布式系统中,就会出现数据不一致的问题。
  4. 二阶段无法解决的问题:协调者在发出commit消息之后宕机,而唯一接受到这条消息的参与者同时也宕机了,那么即使协调者通过选举协议产生了新的协调者,这条事务的状态也是不确定的,没有人知道这个事务是否已经提交。

其实2PC的问题是可以规避的,那就是通过log的日志进行记录,一切的事务提交与否以log记录为主。

3PC

3PC,三阶段提交协议,是二阶段协议的改进版本,三阶段提交有两个改动点:

  1. 在协调者和参与者中都引入超时机制
  2. 在第一阶段和第二阶段中插入一个准备阶段保证了在最后提交阶段之前各个参与节点的状态是一致的

所以3PC会分3个阶段,CanCommit准备阶段,PreCommit预提交阶段,DoCommit提交阶段,处理流程如下:

image-20231209145612446

1. 阶段一:CanCommit 准备阶段

协调者向参与者发送canCommit请求,参与者如果可以提交就返回Yes响应,否则返回No响应,具体流程如下:

  1. 事务询问:协调者向所有参与者发出包含事务内容的canCommit请求,询问是否可以提交事务,并等待所有参与者答复。
  2. 响应反馈:参与者收到canCommit请求后,如果认为可以执行事务操作,则反馈yes,并进入预备状态,否则反馈no。

2. 阶段二:PreCommit阶段

协调者根据参与者的反应情况来决定是否可以进行事务的preCommit操作。根据响应情况,有以下两种可能:

2.1 执行事务:

假如所有参与者均反馈yes,协调者预执行事务,具体如下:

  1. 发送预提交请求:协调者向参与者发送preCommit请求,并进入准备阶段。
  2. 事务预提交:参与者接受到preCommit请求后,会执行本地事务操作,并将undo和redo信息记录到事务日志中,但并不提交事务。
  3. 响应反馈:如果参与者成功的执行了事务操作,则返回ACK响应,同时开始等待最终指令。

image-20231209155121377

2.2 中断事务:

假如有任何一个参与者向协调者发送No响应,或者等待超时之后,协调者都没有接到参与者的响应,那么就执行事务的中断,流程如下:

  1. 发送中断请求:协调者向所有参与者发送abort请求
  2. 中断事务:参与者收到来自协调者的abort请求之后(或者超时之后,仍为收到协调者的请求),执行事务的中断。

image-20231209155150708

3. 阶段三:doCommit阶段

该阶段进行真正的事务提交,也可以分为以下两种情况:

3.1 提交事务:
  1. 发送提交请求:协调接受到所有参与者发送的ACK响应,那么他将从预提交状态进入到提交状态,并向所有参与者发送doCommit请求
  2. 本地事务提交:参与者接受到doCommit请求之后,执行正式的事务提交,并在完成事务提交之后释放所有事务资源
  3. 响应反馈:事务提交完之后,向协调者发送ack响应
  4. 完成事务:协调者接受到所有参与者的ack响应之后,完成事务。

image-20231209155227204

3.2 中断事务:

任何一个参与者反馈no,或者等待超时后,协调者无法收到所有参与者的反馈,即中断业务

  1. 发送中断请求:如果协调者处于工作状态,向所有参与者发出abort请求
  2. 事务回滚:参与者接受到abort请求之后,利用其在二阶段记录的undo信息来执行事务的回滚操作,并在完成回滚之后释放所有的事务资源。
  3. 反馈结果:参与者完成事务回滚之后,向协调者反馈ACK消息
  4. 中断事务:协调者接收参与者反馈的ACK消息之后,执行事务的中断

image-20231209155313301

进入doCommit阶段后,无论协调者出现问题,或者协调者与参与者之间的网络出现问题,都会导致参与者无法接受到协调者发出的doCommit请求或者abort请求。此时,参与者都会在等待超时之后,继续执行事务提交。这其实给予改了来决定,当进入第三阶段时,说明第一阶段收到所有参与者的canCommit的响应都是Yes,所以一句话概括就是,当进入第三阶段时,由于网络超时等原因,虽然参与者没有收到commit或者abort,但是他有理由相信:成功提交的几率很大,比较前面收到所有的canCommit的Yes。

4. 3PC的优缺点

与2PC相比,3PC降低了阻塞范围,并且在等待超时后,协调者或参与者会中断中断事务,避免协调者单点问题,阶段三中协调者出现问题时,参与者会继续提交事务。

数据不一致的问题依旧存在,当在参与者收到preCommit请求后等待doCommit指令时,此时如果协调者请求中断事务,而协调者因为网络问题无法与参与者正常通信,会导致参与者继续提交事务,造成数据不一致

2PC和3PC都无法保证数据绝对的一致性,一般为了预防这种问题,可以添加一个报警,比如监控到事务异常的时候,通过脚本自动补偿差异的信息。

这篇关于分布式事务 | 2PC与3PC 详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/507228

相关文章

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

Linux kill正在执行的后台任务 kill进程组使用详解

《Linuxkill正在执行的后台任务kill进程组使用详解》文章介绍了两个脚本的功能和区别,以及执行这些脚本时遇到的进程管理问题,通过查看进程树、使用`kill`命令和`lsof`命令,分析了子... 目录零. 用到的命令一. 待执行的脚本二. 执行含子进程的脚本,并kill2.1 进程查看2.2 遇到的

MyBatis常用XML语法详解

《MyBatis常用XML语法详解》文章介绍了MyBatis常用XML语法,包括结果映射、查询语句、插入语句、更新语句、删除语句、动态SQL标签以及ehcache.xml文件的使用,感兴趣的朋友跟随小... 目录1、定义结果映射2、查询语句3、插入语句4、更新语句5、删除语句6、动态 SQL 标签7、ehc

详解SpringBoot+Ehcache使用示例

《详解SpringBoot+Ehcache使用示例》本文介绍了SpringBoot中配置Ehcache、自定义get/set方式,并实际使用缓存的过程,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录摘要概念内存与磁盘持久化存储:配置灵活性:编码示例引入依赖:配置ehcache.XML文件:配置

从基础到高级详解Go语言中错误处理的实践指南

《从基础到高级详解Go语言中错误处理的实践指南》Go语言采用了一种独特而明确的错误处理哲学,与其他主流编程语言形成鲜明对比,本文将为大家详细介绍Go语言中错误处理详细方法,希望对大家有所帮助... 目录1 Go 错误处理哲学与核心机制1.1 错误接口设计1.2 错误与异常的区别2 错误创建与检查2.1 基础

Nginx分布式部署流程分析

《Nginx分布式部署流程分析》文章介绍Nginx在分布式部署中的反向代理和负载均衡作用,用于分发请求、减轻服务器压力及解决session共享问题,涵盖配置方法、策略及Java项目应用,并提及分布式事... 目录分布式部署NginxJava中的代理代理分为正向代理和反向代理正向代理反向代理Nginx应用场景

k8s按需创建PV和使用PVC详解

《k8s按需创建PV和使用PVC详解》Kubernetes中,PV和PVC用于管理持久存储,StorageClass实现动态PV分配,PVC声明存储需求并绑定PV,通过kubectl验证状态,注意回收... 目录1.按需创建 PV(使用 StorageClass)创建 StorageClass2.创建 PV

Python版本信息获取方法详解与实战

《Python版本信息获取方法详解与实战》在Python开发中,获取Python版本号是调试、兼容性检查和版本控制的重要基础操作,本文详细介绍了如何使用sys和platform模块获取Python的主... 目录1. python版本号获取基础2. 使用sys模块获取版本信息2.1 sys模块概述2.1.1

一文详解Python如何开发游戏

《一文详解Python如何开发游戏》Python是一种非常流行的编程语言,也可以用来开发游戏模组,:本文主要介绍Python如何开发游戏的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录一、python简介二、Python 开发 2D 游戏的优劣势优势缺点三、Python 开发 3D

Redis 基本数据类型和使用详解

《Redis基本数据类型和使用详解》String是Redis最基本的数据类型,一个键对应一个值,它的功能十分强大,可以存储字符串、整数、浮点数等多种数据格式,本文给大家介绍Redis基本数据类型和... 目录一、Redis 入门介绍二、Redis 的五大基本数据类型2.1 String 类型2.2 Hash