Mysql在线安全变更工具 gh-ost

2024-09-06 13:36

本文主要是介绍Mysql在线安全变更工具 gh-ost,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

gh-ost(GitHub Online Schema Translater)是一个用于安全地进行 MySQL 数据库表结构变更的工具,专门为在线数据库迁移而设计。它的主要优点是可以在不中断业务的情况下,不影响数据库的可用性和性能,进行表结构的修改。

主要特点

  1. 在线迁移gh-ost 允许在高负载的生产环境中进行表结构的更改,而不需要锁定表,确保数据库的可用性。

  2. 渐进式复制:通过逐步复制行,gh-ost 可以在针对大量数据的情况下,避免短时间内的负载高峰。

  3. 安全性:它具备自动回滚功能,如果迁移过程中出现问题,可以安全地回滚到原始状态。

  4. 编程和操作简便:工具使用简单、直观,与 MySQL 客户端兼容,支持使用 SQL 语句进行表结构的更改。

  5. 多种配置选项:支持多种选项用于配置操作,例如并行迁移、最大移动速度等。

使用场景

  • 发布新字段:添加新的列而不影响应用的访问。
  • 修改现有字段类型:安全地改变列的数据类型,比如从 VARCHARTEXT
  • 重命名列:而不影响运行中的系统。

基本用法

  1. 安装:可以通过 github 下载可执行文件,或使用 Homebrew(在 macOS 上)进行安装。

    brew install gh-ost
    
  2. 基本命令
    以下是一个使用 gh-ost 进行表结构变更的基本示例:

    gh-ost \
    --max-load=Threads_running=25 \
    --critical-load=Threads_running=1000 \
    --host=127.0.0.1 \
    --user=username \
    --password=your_password \
    --database=your_database \
    --table=your_table \
    --alter="ADD COLUMN new_col INT DEFAULT 0" \
    --execute
    

    这个命令将向 your_table 表中添加一个名为 new_col 的新列,字段类型为 INT,默认值为 0。

配置选项

  • --max-load:指定允许的最大负载。
  • --critical-load:指定触发回滚的负载。
  • --host--user--password:数据库连接信息。
  • --database--table:要修改的数据库和表名。
  • --alter:指定 ALTER 语句。
  • --execute:表示执行迁移;如果不加这个选项,则只进行干运行(dry run),不实际执行。

gh-ost 数据迁移流程

1. 准备与初始化
  • 安装与配置:确保你的 MySQL 数据库已启用二进制日志(binlog),并安装 gh-ost 工具。
  • 参数设置:使用合适的参数启动 gh-ost,包括连接信息、要迁移的表、变更语句等。
2. 创建临时表
  • 临时表的结构gh-ost 首先会创建一个新的临时表,并按照你的 ALTER 语句的定义,将原有表的结构复制到临时表中
  • 开始复制数据:临时表一旦创建,gh-ost 即可开始将原始表中的现有数据逐行复制到临时表中。
3. 数据复制与变更监控
  • 逐行复制gh-ost 以增量的方式逐行将原始表的数据复制到临时表,这个复制过程是渐进的,确保了对数据库的负载最低。

  • 使用事务隔离:在数据复制的过程中,gh-ost 使用 REPEATABLE READ 事务隔离级别。这意味着在数据复制期间,原始表的读取是一个快照,不会受到其他事务的影响。

  • 监控二进制日志(binlog)

    • 同时,gh-ost 启动一个线程,实时监控 MySQL 的 binlog,捕获所有对原始表的变更(包括 INSERT、UPDATE、DELETE)。
    • 这允许 gh-ost 捕获到在数据复制过程中对原始表的任何更新。
4. 实时同步变更
  • 处理变更

    • 任何在数据复制过程中对原始表的变更(例如:INSERT 或 UPDATE)都会被 gh-ost 监控到并记录在 binlog 中。
    • gh-ost 会将这些变化实时应用到临时表中(不会等到复制完成后,再处理变更数据),确保临时表里的数据与原始表保持同步。
  • 最终更新操作

    • 对于原始表的更新操作,如果在复制到某一行时,该行数据已经被修改,gh-ost 将依赖于二进制日志来更新临时表,以阻止出现数据不一致的情况。
5. 表切换
  • 完成复制与更新

    • 一旦所有的数据都已复制,并且所有的二进制日志变更均已同步到临时表,gh-ost 将进行最后的检查。
  • 原子重命名

    • gh-ost 进行原子操作,将原始表重命名为备份名称(例如:your_table_old),然后将临时表重命名为原始表的名称(例如:your_table)。
    • 这一过程确保在任何时刻,数据库中的数据都是一致的,并且整个迁移操作对外界是透明的。
6. 清理与回滚
  • 删除旧表:如果配置允许,gh-ost 可以安全删除旧表,以释放资源。
  • 回滚机制
    • 如果在迁移过程中发生错误,gh-ost 会提供回滚功能,能够安全地将数据库恢复到原始状态,从而确保错误不会影响数据库的运作和数据的完整性。

总结

gh-ost 通过以上步骤实现了在线、安全、逐渐的 MySQL 数据迁移。其设计保证了在整个过程中,数据的一致性和准确性,以及对生产系统的影响最小。利用事务隔离和二进制日志捕获gh-ost 确保所有变更都在迁移过程中得以有效处理,最终实现平滑的表结构更新。

这篇关于Mysql在线安全变更工具 gh-ost的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1142148

相关文章

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么?二、Online DDL 的三种主要算法2.1COPY(复制法)

基于Python开发Windows自动更新控制工具

《基于Python开发Windows自动更新控制工具》在当今数字化时代,操作系统更新已成为计算机维护的重要组成部分,本文介绍一款基于Python和PyQt5的Windows自动更新控制工具,有需要的可... 目录设计原理与技术实现系统架构概述数学建模工具界面完整代码实现技术深度分析多层级控制理论服务层控制注

mysql8.0.43使用InnoDB Cluster配置主从复制

《mysql8.0.43使用InnoDBCluster配置主从复制》本文主要介绍了mysql8.0.43使用InnoDBCluster配置主从复制,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录1、配置Hosts解析(所有服务器都要执行)2、安装mysql shell(所有服务器都要执行)3、

k8s中实现mysql主备过程详解

《k8s中实现mysql主备过程详解》文章讲解了在K8s中使用StatefulSet部署MySQL主备架构,包含NFS安装、storageClass配置、MySQL部署及同步检查步骤,确保主备数据一致... 目录一、k8s中实现mysql主备1.1 环境信息1.2 部署nfs-provisioner1.2.

MySQL中VARCHAR和TEXT的区别小结

《MySQL中VARCHAR和TEXT的区别小结》MySQL中VARCHAR和TEXT用于存储字符串,VARCHAR可变长度存储在行内,适合短文本;TEXT存储在溢出页,适合大文本,下面就来具体的了解... 目录一、VARCHAR 和 TEXT 基本介绍1. VARCHAR2. TEXT二、VARCHAR

MySQL中C接口的实现

《MySQL中C接口的实现》本节内容介绍使用C/C++访问数据库,包括对数据库的增删查改操作,主要是学习一些接口的调用,具有一定的参考价值,感兴趣的可以了解一下... 目录准备mysql库使用mysql库编译文件官方API文档对象的创建和关闭链接数据库下达sql指令select语句前言:本节内容介绍使用C/

mybatis直接执行完整sql及踩坑解决

《mybatis直接执行完整sql及踩坑解决》MyBatis可通过select标签执行动态SQL,DQL用ListLinkedHashMap接收结果,DML用int处理,注意防御SQL注入,优先使用#... 目录myBATiFBNZQs直接执行完整sql及踩坑select语句采用count、insert、u

MySQL之搜索引擎使用解读

《MySQL之搜索引擎使用解读》MySQL存储引擎是数据存储和管理的核心组件,不同引擎(如InnoDB、MyISAM)采用不同机制,InnoDB支持事务与行锁,适合高并发场景;MyISAM不支持事务,... 目录mysql的存储引擎是什么MySQL存储引擎的功能MySQL的存储引擎的分类查看存储引擎1.命令

Java JUC并发集合详解之线程安全容器完全攻略

《JavaJUC并发集合详解之线程安全容器完全攻略》Java通过java.util.concurrent(JUC)包提供了一整套线程安全的并发容器,它们不仅是简单的同步包装,更是基于精妙并发算法构建... 目录一、为什么需要JUC并发集合?二、核心并发集合分类与详解三、选型指南:如何选择合适的并发容器?在多