为什么 MySQL 选择 Repeatable Read 作为默认隔离级别

2023-10-31 22:20

本文主要是介绍为什么 MySQL 选择 Repeatable Read 作为默认隔离级别,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

为什么 MySQL 选择 Repeatable Read 作为默认隔离级别?

在这里插入图片描述
我们知道,ANSI/ISO SQL-92 标准定义了 4 种隔离级别,从低到高依次为:
读未提交(Read Uncommitted)、读已提交(Read Committed)、可重复读(Repeatable Reads)、序列化(Serializable)。

在 RU 级别下,可能会出现脏读、幻读、不可重复读等问题。
在 RC 级别下,解决了脏读的问题,但仍存在幻读、不可重复读的问题。
在 RR 级别下,解决了脏读和不可重复读的问题,但仍存在幻读的问题。
在 Serializable 隔离级别下,解决了脏读、幻读、不可重复读全部问题。

然而,Oracle数据库只支持 Serializable 和 Read Committed 。
需要注意的是,Oracle的默认隔离级别是RC,而MySQL的默认隔离级别是RR
那么,你知道为什么Oracle选择RC作为默认级别,而MySQL选择RR作为默认的隔离级别吗?

Oracle 的隔离级别

前面我们提到过,Oracle只支持ANSI/ISO SQL定义的Serializable和Read Committed隔离级别。

但实际上,根据Oracle官方文档的介绍,Oracle支持三种隔离级别:Read Committed、Serializable 和 Read-Only。
在这里插入图片描述
官网链接:

https://docs.oracle.com/cd/E11882_01/server.112/e40540/consist.htm#CNCPT621

Read-Only 隔离级别类似于序列化隔离级别,但只读事务甚至不允许在事务中进行数据修改。

因此,在这三种隔离级别中,Serializable 和 Read-Only 显然都不适合作为默认隔离级别,Oracle 只剩下 Read Committed 这个选择。

MySQL 的隔离级别

MySQL 默认使用RR(可重复读)隔离级别的原因是基于历史和技术考虑。

MySQL 主从复制是通过 binlog 日志进行数据同步的,而早期的版本中 binlog 记录的是SQL语句的原文。
在这里插入图片描述

而早期的版本的 statement 格式下,记录到 binlog 里的是SQL语句原文,因此可能会出现这样一种情况:

例如这样一条SQL语句:
在这里插入图片描述
在主库执行这条 SQL 语句的时候,用的是索引 a;而在备库执行这条 SQL 语句的时候,却使用了索引 b。

【MySQL 执行优化器会进行采样预估,在不同的MySQL库里,采样计算出来的预估结果不一样,会影响优化器的判断,由于优化器会进行成本分析,可能最终选择的索引不一样。】

而又因为这条 delete 语句带了 limit,很可能会出现主备数据不一致的情况。

因此,MySQL 认为这样写是有风险的。

另外,如果使用读已提交(Read Committed)或读未提交(Read Uncommitted)这两种隔离级别,是不会添加 Gap Lock 间隙锁的。

而主从复制过程中出现的事务乱序的问题,更加容易导致备库在SQL回滚之后与主库内容不一致。

为了解决这个问题,MySQL选择了可重复读(Repeatable Read)隔离级别作为默认选项。

可重复读隔离级别,在更新数据时会增加记录锁和间隙锁,可以避免事务乱序导致的数据不一致问题。

在这里插入图片描述
除了设置默认的隔离级别外,MySQL还禁止在使用 statement 格式的 bin log 情况下,使用 READ COMMITTED 作为事务隔离级别。
一旦用户主动修改隔离级别,尝试更新时,会报错:
在这里插入图片描述
所以,现在我们知道了,为什么MySQL选择RR作为默认的数据库隔离级别了
其实就是为了兼容历史上的那种 statement 格式的bin log,解决主从复制过程中的数据一致性问题。

为什么默认 RR,大厂要改成 RC?

尽管 MySQL 默认使用 RR 隔离级别,是为了解决主从复制过程中的数据一致性问题,但在实际应用中,根据具体需求和性能考虑,可以选择适合的隔离级别。

对于「读已提交」和「可重复读」两种隔离级别的事务来说,它们都是通过 Read View 来实现的。
它们的区别在于创建 Read View 的时机不同:
RC「读已提交」隔离级别是在每个 select 查询时都会生成一个新的 Read View。
这意味着,如果在事务期间的多次读取同一条数据,前后两次读的数据可能会出现不一致的情况,因为可能这期间另外一个事务修改了该记录,并提交了事务。
RR「可重复读」隔离级别是在启动事务时生成一个 Read View,然后在整个事务期间都使用这个 Read View。
这样就保证了在事务期间读到的数据都是事务启动前的记录。
在这里插入图片描述
一些大型互联网公司,如阿里等会根据自身需求,将数据库的隔离级别从默认的 RR 调整为 RC(读已提交)。

这是因为 RC 隔离级别可以提供更高的并发度和降低死锁发生的概率。

对于互联网公司来说最重要的是什么?
当然是,高并发!

RC 隔离级别在一致性读方面比 RR 更加灵活。
在 RC 隔离级别下,每次读取都会重新生成一个快照,总是读取行的最新版本。
这意味着 RC 隔离级别可以提供更高的并发度,允许读取其他事务已提交的数据,从而减少了锁的竞争和等待时间。
这对于互联网公司来说,特别是在高并发的场景下,可以提升系统的性能和响应速度。

在这里插入图片描述
其次,RC隔离级别可以降低死锁的发生概率。
在 RR 隔离级别下,由于锁的范围更广,可能会导致更多的锁竞争和死锁情况。
而在 RC 隔离级别下,由于只对已提交的数据进行读取,锁的范围更小,减少了死锁的可能性。
此外,RC隔离级别相对于RR隔离级别来说,对于一些特定的业务场景更加适用。
例如,对于一些需要实时数据的应用,RC 隔离级别可以提供更及时的数据更新,满足业务需求。
然而,RC 隔离级别仍然存在幻读和不可重复读的问题。就需要自己解决了。

而且,很多时候,不可重复读问题其实是可以忽略的。

比如,读取到别的事务修改的值,其实问题不太大的,只要修改的时候的不基于错误数据就可以了。

所以,我们都会在核心表中增加乐观锁标记,更新的时候都要带上锁标记,进行乐观锁更新。

在这里插入图片描述
总结起来,MySQL 默认使用 RR 隔离级别是为了解决,主从复制过程中的数据一致性问题,但在实际应用中,需要根据具体需求和性能考虑,可以选择适合的隔离级别。

这篇关于为什么 MySQL 选择 Repeatable Read 作为默认隔离级别的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/318519

相关文章

PostgreSQL 默认隔离级别的设置

《PostgreSQL默认隔离级别的设置》PostgreSQL的默认事务隔离级别是读已提交,这是其事务处理系统的基础行为模式,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价... 目录一 默认隔离级别概述1.1 默认设置1.2 各版本一致性二 读已提交的特性2.1 行为特征2.2

一文详解MySQL如何设置自动备份任务

《一文详解MySQL如何设置自动备份任务》设置自动备份任务可以确保你的数据库定期备份,防止数据丢失,下面我们就来详细介绍一下如何使用Bash脚本和Cron任务在Linux系统上设置MySQL数据库的自... 目录1. 编写备份脚本1.1 创建并编辑备份脚本1.2 给予脚本执行权限2. 设置 Cron 任务2

SQL Server修改数据库名及物理数据文件名操作步骤

《SQLServer修改数据库名及物理数据文件名操作步骤》在SQLServer中重命名数据库是一个常见的操作,但需要确保用户具有足够的权限来执行此操作,:本文主要介绍SQLServer修改数据... 目录一、背景介绍二、操作步骤2.1 设置为单用户模式(断开连接)2.2 修改数据库名称2.3 查找逻辑文件名

SQL Server数据库死锁处理超详细攻略

《SQLServer数据库死锁处理超详细攻略》SQLServer作为主流数据库管理系统,在高并发场景下可能面临死锁问题,影响系统性能和稳定性,这篇文章主要给大家介绍了关于SQLServer数据库死... 目录一、引言二、查询 Sqlserver 中造成死锁的 SPID三、用内置函数查询执行信息1. sp_w

canal实现mysql数据同步的详细过程

《canal实现mysql数据同步的详细过程》:本文主要介绍canal实现mysql数据同步的详细过程,本文通过实例图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的... 目录1、canal下载2、mysql同步用户创建和授权3、canal admin安装和启动4、canal

SQL中JOIN操作的条件使用总结与实践

《SQL中JOIN操作的条件使用总结与实践》在SQL查询中,JOIN操作是多表关联的核心工具,本文将从原理,场景和最佳实践三个方面总结JOIN条件的使用规则,希望可以帮助开发者精准控制查询逻辑... 目录一、ON与WHERE的本质区别二、场景化条件使用规则三、最佳实践建议1.优先使用ON条件2.WHERE用

MySQL存储过程之循环遍历查询的结果集详解

《MySQL存储过程之循环遍历查询的结果集详解》:本文主要介绍MySQL存储过程之循环遍历查询的结果集,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言1. 表结构2. 存储过程3. 关于存储过程的SQL补充总结前言近来碰到这样一个问题:在生产上导入的数据发现

MySQL 衍生表(Derived Tables)的使用

《MySQL衍生表(DerivedTables)的使用》本文主要介绍了MySQL衍生表(DerivedTables)的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学... 目录一、衍生表简介1.1 衍生表基本用法1.2 自定义列名1.3 衍生表的局限在SQL的查询语句select

MySQL 横向衍生表(Lateral Derived Tables)的实现

《MySQL横向衍生表(LateralDerivedTables)的实现》横向衍生表适用于在需要通过子查询获取中间结果集的场景,相对于普通衍生表,横向衍生表可以引用在其之前出现过的表名,本文就来... 目录一、横向衍生表用法示例1.1 用法示例1.2 使用建议前面我们介绍过mysql中的衍生表(From子句

六个案例搞懂mysql间隙锁

《六个案例搞懂mysql间隙锁》MySQL中的间隙是指索引中两个索引键之间的空间,间隙锁用于防止范围查询期间的幻读,本文主要介绍了六个案例搞懂mysql间隙锁,具有一定的参考价值,感兴趣的可以了解一下... 目录概念解释间隙锁详解间隙锁触发条件间隙锁加锁规则案例演示案例一:唯一索引等值锁定存在的数据案例二: