MySQL中闪回功能的方案讨论及实现

2025-03-21 13:50

本文主要是介绍MySQL中闪回功能的方案讨论及实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《MySQL中闪回功能的方案讨论及实现》Oracle有一个闪回(flashback)功能,能够用户恢复误操作的数据,这篇文章主要来和大家讨论一下MySQL中支持闪回功能的方案,有需要的可以了解下...

oracle有一个闪回(flashback)功能,能够用户恢复误操作的数据。本文讨论mysql中支持闪回的方案。

1、 闪回的目标

即使为了数据安全,我们搭建了主从。但实时主从备份只能防止硬件问题,比如主库的硬盘损坏。但对于误操作,则无能为力。比如在主库误删一张表,或者一个update语句没有指定where条件,导致全表被更新。当操作被同步到从库上后,则主从都“回天无力”。

线上或者测试环境经常出现的误操作总是让DBA同学那么闹心。

闪回的目的是要让数据库在commit之后,还能恢复到之前的某个状态,整库或指定的表。

这里我们讨论用binlog来实现闪回的方案。

2、 无米无炊一

恢复到之前的某个状态,是需要数据的。这数据可以是 a) 回滚步骤 或者 b) 操作之前的数据状态原文。

但我们知道,若使用statement,并没有上述需要的数据。试想binlog中记录了一句update t set f1=3 where id=3。怎么恢复呢?

因此,我们的第一个“米”,就是binlog必须是row based的。在row base下,binlog同时记录了更新前后的整行记录。

a)单个语句的闪回

了row base的binlog后,我们来分析一下怎么实现闪回。平时的DML无非三种操作,增删改,先说三种操作的日志格式。

一个语句分成两个event (实际上不止,其他可以忽略), 一个table_map event 和 一个Rows_log_event。Table_map event是一样的,主要看Rows_log_event。

每个Rows_log_event中包含event_type, 可选值为WRITE_ROWS_EVENT、UPDATE_ROWS_EVENT、DELETE_ROWS_EVENT。从宏名字就能看出用途。

对于insert和delete,event中包含了插入/删除的记录的所有字段的值(太爽了。。)

对于update操作,event中依次记录旧行, 新行的值。

因此我们看到,这些信息足够让我们对单个操作实现“逆操作”。

i. 对于insert操作,只需要把event_type改成DELETE_ROWS_EVENT;对于delete操作,改成WRITE_ROWS_EVENT

ii.  对于update操作,只需要把event中的旧行和新行值对调即可。

b)binlog的闪回

我们只需要把binlog文件反向执行,每个操作都执行逆操作即可。当然也不是所有的event都反转。Table_map event必须还是在Rows_log_event每个操作之前。目前的方案是用mysqlbinlog工具,增加一个flashback参数,输出结果为一个新的binlog文件――姑且叫做flashbacklog,这个flashbacklog顺序执行,www.chinasem.cn可制定某张表和执行到哪个pos,来实现数据库的闪回。 

3、 无米无炊二

上面我们说了DML的闪回方案。但对于DDL却无能为力,对于大多数的ddl,即使是row base格式,binlog中仍只记录语句本身。对于删表操作,只记录一个语句drop table t。仅凭这句话,无法还原表的数据。

虽然可以将一个drop table语句转换成先delete再删表,性能却会降低很多。这里我们用上面说道的另外一种可用数据:“操作前数据备份”。

按顺序我们先讨论怎么保存数据,再讨论怎么闪回。WAWdaECD

保存数据

先说DDL的分类。有一类DDL,是不需要重建表的,比如加非聚簇索引。这类操作其实不会丢数据,也是在原表上直接操作,对于我们“以恢复数据为目的”的闪回,是可以先忽略的。 另外一类,则是会影响到表数据的操作。比如

a)  Drop/truncate table

这两个操作直接把表数据清空。

b) &nbspythonp; Alter table add、drop、change column

这类操作的执行过程是,1) 按照新的表定义建立一个临时表tmpa,2) 将原表数据拷贝到临时表,3)将原始表改名tmpb,4)将tmpa改名为原表名,5)将tmpb删除。

我们分析上面的两个操作,都有一个“删除数据”的过程。

因此我们的保存数据方法就是:在删除的动作开始之前,把表数据备份起来,然后留一个空表,在空表上执行“删除”操作。

用一个库 #bak_database存放这些历史数据。

闪回

有了数据以后,我们就要想一个比较统一的方法来闪回。上面我们说了对于DML操作,可以通过反向执行所有逆操作来实现,对于语句里面的DDL,只能直接跳过。原因是一个DDL不一定有直接的逆操作。

因此我们的方案中要构造这种逆操作。Event_type增加一种FLASHBACK_EVENT。这类操作形式与Query_Event相同,都是简单的SQL语句,只是包含了将数据恢复的操作。

举例:

a)   对于altert table t add column 操作。

我们在操作的过程中将临时表tmpb,不删除,而是保存到 #bak_database.#bak_table_xxxxx (后缀用于去重),在我的patch中用当前的时刻(微秒)。

对于这个语句,我们生成两条FLASHBACK_EVENT,分别是 alter table `#bak_database`.`#bak_table_xxxxx` rename to `my_db`.`my_tbl`; 和 drop table  `my_db`.`my_tbl`;

这里的my_db和my_tbl分别为原来的库名和表名。

所以mysqlbinlog工具怎么处理FLASHBACK_EVENT这类event呢,直接执行就行了。(注意这两个event也是反向执行的,所以在恢复的时候是先删除`my_db`.`my_tbl`,再从#bChina编程ak_database恢复回来)

b)对于drop table操作

由于实际操作会把这个表删,只需要一个alter table `#bak_database`.`#bak_table_xxxxx` rename to `my_db`.`my_tbl`; 即可。

4、 演示

初始状态我们库中只有一个表 test.tb,两行

CREATE TABLE `tb` (
`c` int(11) NOT NULL DEFAULT '0′,
 `d` int(11) DEFAULT NULL,
  PRIMARY KEY (`c`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;mysql> select * from tb;
+——+——+
| c    | d    |
+——+——+
|    1 |   10 |
|    2 |   20 |
+——+——+

模拟一个DML和一个DDL

insert into tb values(3,30);
alter table tb drop column d;  

这两个操作后在binlog文件中生成的结果如下

MySQL中闪回功能的方案讨论及实现

说明:

将mysqlbinloig中的其他信息去掉,其中红色框中为insert语句产生的binlog,在flashback工具中会被转化为delete操作。

两个蓝色框中的即为我们生成的FLASHBACK_EVENT。除了event_type与普通的query_event不同,还将库名+表名放在语句的前面,目的是为了flashback工具执行按表闪回的时候可以直接识别表名,不需要解析biWAWdaECDnlog语句。

紫色框中就是那个真正的DDL操作,在flashback工具中被忽略。

所以上面的binlog被flashback工具解析后的结果是两个DDL语句和一个delete操作,能够恢复到表的初始状态。

5、小结

这里讨论了MySQL闪回的一种方案.

增加一种新的event_type, 不会影响原来mysqlbinlog工具的使用;

备份即将删除的表,没有增加额外的操作,不会对正常操作性能造成影响(当然需要更多的存储空间)。

实际上我们上面还留了一个“空挡”没有讨论,在方案完成后补充。

涉及到MySQL server本身和mysqlbinlog这个工具两部分的修改,MySQL工具部分由@plinux同学实现。(其实如果不恢复DDL,可以只使用这个工具).  server部分的改动可以只部署slave,这样slave同时担负备份和闪回准备的功能。

到此这篇关于MySQL中闪回功能的方案讨论及实现的文章就介绍到这了,更多相关MySQL闪回内容请搜索编程China编程(www.chinasem.cn)以前的文章或继续浏览下面的相关文章希望大家以后多多支持China编程(www.chinasem.cn)!

这篇关于MySQL中闪回功能的方案讨论及实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1153870

相关文章

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

C++中unordered_set哈希集合的实现

《C++中unordered_set哈希集合的实现》std::unordered_set是C++标准库中的无序关联容器,基于哈希表实现,具有元素唯一性和无序性特点,本文就来详细的介绍一下unorder... 目录一、概述二、头文件与命名空间三、常用方法与示例1. 构造与析构2. 迭代器与遍历3. 容量相关4

C++中悬垂引用(Dangling Reference) 的实现

《C++中悬垂引用(DanglingReference)的实现》C++中的悬垂引用指引用绑定的对象被销毁后引用仍存在的情况,会导致访问无效内存,下面就来详细的介绍一下产生的原因以及如何避免,感兴趣... 目录悬垂引用的产生原因1. 引用绑定到局部变量,变量超出作用域后销毁2. 引用绑定到动态分配的对象,对象

SpringBoot基于注解实现数据库字段回填的完整方案

《SpringBoot基于注解实现数据库字段回填的完整方案》这篇文章主要为大家详细介绍了SpringBoot如何基于注解实现数据库字段回填的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解... 目录数据库表pom.XMLRelationFieldRelationFieldMapping基础的一些代

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java AOP面向切面编程的概念和实现方式

《JavaAOP面向切面编程的概念和实现方式》AOP是面向切面编程,通过动态代理将横切关注点(如日志、事务)与核心业务逻辑分离,提升代码复用性和可维护性,本文给大家介绍JavaAOP面向切面编程的概... 目录一、AOP 是什么?二、AOP 的核心概念与实现方式核心概念实现方式三、Spring AOP 的关

Python实现字典转字符串的五种方法

《Python实现字典转字符串的五种方法》本文介绍了在Python中如何将字典数据结构转换为字符串格式的多种方法,首先可以通过内置的str()函数进行简单转换;其次利用ison.dumps()函数能够... 目录1、使用json模块的dumps方法:2、使用str方法:3、使用循环和字符串拼接:4、使用字符

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么?二、Online DDL 的三种主要算法2.1COPY(复制法)

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

Linux挂载linux/Windows共享目录实现方式

《Linux挂载linux/Windows共享目录实现方式》:本文主要介绍Linux挂载linux/Windows共享目录实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录文件共享协议linux环境作为服务端(NFS)在服务器端安装 NFS创建要共享的目录修改 NFS 配