十. MySQL并行复制

2024-04-30 08:38
文章标签 mysql database 并行复制

本文主要是介绍十. MySQL并行复制,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

并行复制的演进

MySQL最早的主备复制只有两个线程,IO 线程负责从主库接收 binlog 日志,并保存在本地的 relaylog 中,SQL线程负责解析和重放 relaylog 中的 event。当主库并行写入压力较大时,备库 IO 线程一般不会产生延迟,因为写 relaylog 是顺序写,但是 SQL线程重放的速度经常跟不上主库写入的速度,会造成主备延迟。如果延迟过大,relaylog 一直在备库堆积,还可能把磁盘占满。

在官方的5.6版本之前,MySQL只支持单线程复制,因此在主库并发高,TPS高时就会出现严重的主备延迟问题。从单线程复制到最新版本的多线程复制,中间的演化经历了好几个版本。

多线程复制,具体方法就是把sql_thread,拆成多个worker线程,由一个coordinator分发到不同的worker,实现并行复制。coordinator在分发的时候,需要满足以下这两个条件:

1.不能造成更新覆盖。也就是更新同一行的两个事务,必须被分发到同一个worker中。

2.同一个事务不能被拆开,必须放到同一个worker中。

MySQL 5.6版本的并行复制策略

MySQL 5.6版本支持了按库并行复制。按库并行复制的并行效果,取决于压力模型。如果在主库上有多个DB,并且各个DB的压力均衡,使用这个策略的效果会很好。但是,如果主库上的表都放在同一个DB里面,这个策略就没有效果了。

MariaDB的并行复制策略

在前面的文章中,我们介绍了redo log的组提交(group commit)优化,而MariaDB的并行复制策略利用的就是这个特性:

1.能够在同一组里提交的事务,一定不会修改同一行。

2.主库上可以并行执行的事务,备库上也一定是可以并行执行的。

在实现上,MariaDB是这么做的:

1.在一组里面一起提交的事务,有一个相同的 commit_id,下一组就是commid_id+1;

2.commit_id直接写到binlog里面。

3.传到备库的时候,相同commit_id的事务分发到多个worker执行。

4.这一组全部执行完成后,coordinator再去取下一批。

MariaDB的方案很容易被大事务拖后腿。假如一组事务有trx1,trx2,trx3,trx2是一个超大事务。在应用到备库的时候,trx1,trx3执行完成后,只能等trx2执行完成,下一组才能开始执行。这段时间,只有一个worker线程在工作,是对资源的浪费。

MySQL 5.7的并行复制策略

在MariaDB并行复制实现后,官方的MySQL 5.7版本也提供了类似的功能,由参数slave-parallel-type来控制并行复制策略:

1.配置为DATABASE,表示使用MySQL 5.6版本的按库并行策略。

2.配置为LOGICAL_CLOCK,表示使用类似mariaDB的策略。MySQL 5.7对这个策略做了优化。

MySQL 5.7优化后的并行复制策略是:

1.同时处于prepare状态的事务,在备库执行时是可以并行的。

2.处于prepapre状态的事务,与处于commit状态的事务之间,在备库执行时也是可以并行的。

在前面我们讲binlog的组提交的时候,介绍过两个参数:

1.binlog_group_commit_sync_delaya参数,表示延迟多少微秒后才fsync。

2.binlog_group_commit_sync_no_delay_count参数,表示累积多少次以后才调用fsync。

这两个参数是用于故意拉长binlog从write到fsync的时间,以此减少binlog的写盘次数。在MySQL 5.7的并行复制策略里,它们可以用来制造更多的处于prepare阶段的事务,这样就增加里备库复制的并行度。

MySQL 5.7.22的并行复制策略

在5.7.22版本里,MySQL增加了基于WRITESET的并行复制策略。相应的,增加了一个参数binlog-transaction-dependency-tracking,用来控制是否启用这个新策略,这个参数的可选值有以下三种:

1.COMMOT_ORDER,表示的就是前面介绍的,根据同时进入prepare和commit来判断是否可以并行的策略。

2.WRITESET,表示的是如果对于事务涉及更新的每一行,计算出这一行的hash值,组成集合writeset。如果两个事务没有操作相同的行,也就是说 它们的writeset没有交集,就可以并行。

3.WRITESET_SESSION,是在WRITESET的基础上多了一个约束,即在主库上同一个线程先后执行的两个事务,在备库执行的时候,要保证 相同的先后顺序。

对于“表上没主键”和“外键约束”的场景,WRITESET策略也是没法并行的,也会暂时退化为单线程模型。

这篇关于十. MySQL并行复制的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/948395

相关文章

SQL Server 中的表进行行转列场景示例

《SQLServer中的表进行行转列场景示例》本文详细介绍了SQLServer行转列(Pivot)的三种常用写法,包括固定列名、条件聚合和动态列名,文章还提供了实际示例、动态列数处理、性能优化建议... 目录一、常见场景示例二、写法 1:PIVOT(固定列名)三、写法 2:条件聚合(CASE WHEN)四、

Mybatis对MySQL if 函数的不支持问题解读

《Mybatis对MySQLif函数的不支持问题解读》接手项目后,为了实现多租户功能,引入了Mybatis-plus,发现之前运行正常的SQL语句报错,原因是Mybatis不支持MySQL的if函... 目录MyBATis对mysql if 函数的不支持问题描述经过查询网上搜索资料找到原因解决方案总结Myb

MySQL 筛选条件放 ON后 vs 放 WHERE 后的区别解析

《MySQL筛选条件放ON后vs放WHERE后的区别解析》文章解释了在MySQL中,将筛选条件放在ON和WHERE中的区别,文章通过几个场景说明了ON和WHERE的区别,并总结了ON用于关... 今天我们来讲讲数据库筛选条件放 ON 后和放 WHERE 后的区别。ON 决定如何 "连接" 表,WHERE

mysql_mcp_server部署及应用实践案例

《mysql_mcp_server部署及应用实践案例》文章介绍了在CentOS7.5环境下部署MySQL_mcp_server的步骤,包括服务安装、配置和启动,还提供了一个基于Dify工作流的应用案例... 目录mysql_mcp_server部署及应用案例1. 服务安装1.1. 下载源码1.2. 创建独立

Mysql中RelayLog中继日志的使用

《Mysql中RelayLog中继日志的使用》MySQLRelayLog中继日志是主从复制架构中的核心组件,负责将从主库获取的Binlog事件暂存并应用到从库,本文就来详细的介绍一下RelayLog中... 目录一、什么是 Relay Log(中继日志)二、Relay Log 的工作流程三、Relay Lo

MySQL日志UndoLog的作用

《MySQL日志UndoLog的作用》UndoLog是InnoDB用于事务回滚和MVCC的重要机制,本文主要介绍了MySQL日志UndoLog的作用,文中介绍的非常详细,对大家的学习或者工作具有一定的... 目录一、Undo Log 的作用二、Undo Log 的分类三、Undo Log 的存储四、Undo

MySQL游标和触发器的操作流程

《MySQL游标和触发器的操作流程》本文介绍了MySQL中的游标和触发器的使用方法,游标可以对查询结果集进行逐行处理,而触发器则可以在数据表发生更改时自动执行预定义的操作,感兴趣的朋友跟随小编一起看看... 目录游标游标的操作流程1. 定义游标2.打开游标3.利用游标检索数据4.关闭游标例题触发器触发器的基

MySQL查看表的历史SQL的几种实现方法

《MySQL查看表的历史SQL的几种实现方法》:本文主要介绍多种查看MySQL表历史SQL的方法,包括通用查询日志、慢查询日志、performance_schema、binlog、第三方工具等,并... 目录mysql 查看某张表的历史SQL1.查看MySQL通用查询日志(需提前开启)2.查看慢查询日志3.

MySQL底层文件的查看和修改方法

《MySQL底层文件的查看和修改方法》MySQL底层文件分为文本类(可安全查看/修改)和二进制类(禁止手动操作),以下按「查看方法、修改方法、风险管控三部分详细说明,所有操作均以Linux环境为例,需... 目录引言一、mysql 底层文件的查看方法1. 先定位核心文件路径(基础前提)2. 文本类文件(可直

MySQL数据目录迁移的完整过程

《MySQL数据目录迁移的完整过程》文章详细介绍了将MySQL数据目录迁移到新硬盘的整个过程,包括新硬盘挂载、创建新的数据目录、迁移数据(推荐使用两遍rsync方案)、修改MySQL配置文件和重启验证... 目录1,新硬盘挂载(如果有的话)2,创建新的 mysql 数据目录3,迁移 MySQL 数据(推荐两