【MySQL进阶之路】千万级数据删除导致的慢查询SQL调优实战

本文主要是介绍【MySQL进阶之路】千万级数据删除导致的慢查询SQL调优实战,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

欢迎关注公众号(通过文章导读关注:【11来了】),及时收到 AI 前沿项目工具及新技术的推送!

在我后台回复 「资料」 可领取编程高频电子书
在我后台回复「面试」可领取硬核面试笔记

文章导读地址:点击查看文章导读!

感谢你的关注!

在这里插入图片描述

千万级数据删除导致的慢查询SQL调优实战

先说一下案例背景:

刚开始,线上系统收到了大量的慢查询告警,检查之后,发现慢查询的都是一些比较简单的 SQL 语句,基本上都是单行查询,因此理论上性能应该是极高的,但是却变成了慢查询,因此考虑可能不是 SQL 语句性能的问题,而是 MySQL 服务器负载过高从而导致 SQL 语句执行过慢!

MySQL 服务器负载过高所导致的问题:

  • 如果 MySQL 的 磁盘 IO 负载过高 ,那么此时你的 SQL 语句来执行的时候,那么 MySQL 可能就顾不上你的磁盘请求了,导致你的 SQL 执行速度过慢
  • 如果 MySQL 的 网络 IO 负载过高 ,会导致你的应用与 MySQL 建立连接以及数据发送的速度过慢,从而导致 SQL 执行速度过慢的现象出现
  • 如果 MySQL 的 CPU 负载过高 也会导致这种情况出现,CPU 负责的任务太多了,导致轮不到你的 SQL 执行任务,从而导致 SQL 执行过慢

1、因此,第一步就是先排查 MySQL 服务器的问题

那么在查看服务器负载之后,发现磁盘 IO、网络 IO、内存、CPU 负载都处于正常水平,并没有出现高负载的情况,因此慢查询的原因应该不是服务器负载过高所导致的

2、第二步是对 SQL 语句的执行耗时进行分析

使用 MySQL 中的 profilling 工具来对 SQL 语句进行性能分析,profilling 工具记录了 SQL 语句的各种资源使用情况,包括 CPU、IO、上下文切换、内存使用等情况

  • 先通过命令开启会话级别的 profilling 功能,之后 MySQL 就会记录 SQL 语句的 profilling 信息了:
SET profiling = 1;
  • 分析 SQL 语句

使用 SHOW PROFILES 命令可以查看当前会话中所有已执行的SQL语句的Profiling信息

要查看特定SQL语句的详细信息,可以使用 SHOW PROFILE 命令,指定相应的查询ID(Query_ID)

# 查看所有 SQL 语句的 profilling 信息以及 query id
show profiles;
# 查看指定 SQL 语句信息
show profile cpu, block io for query [query_id]

当分析了 SQL 语句的 profilling 信息之后,发现它的 Sending Data 耗时最高,SQL 执行耗时 1s 左右,Sending Data 就占用了几乎 1s,因此 SQL 执行速度慢的原因找到了,是因为 Sending Data

3、进一步分析

但是仅仅凭借 Sending Data 还找不出为什么 SQL 执行这么慢,因此使用了 show engine innodb status 命令来查看 InnoDB 存储引擎当前的状态,此时发现 history list length 值特别大,达到了上万的级别

那么通过查询相关资料发现 history list length 值特别大表明数据库中有着大量事务正在执行,大量事务在执行的时候,会去构建 MVCC 的 undo log 版本链,如果大量事务一直不结束,就会导致这个 undo log 版本链过长,最后导致 history list length 值特别大

image-20240213124111081

因此猜测原因可能与 MySQL 中正在执行的大量事务有关

4、找到原因

那么经过排查,发现后台在跑一个定时任务,这个定时任务开启了一个事务去删除上千万条数据,并且这个事务运行的时间也很长,因此导致这个事务在运行期间,产生了大量的 undo log 版本链

那么此时其他事务来查询数据的时候,会把这些上千万条删除的数据都扫描一遍,因为这些数据是在记录版本链中的,而查询的话通过 MVCC 机制是需要去扫描记录版本链,因此 SQL 慢查询的原因就找到了:长事务中大量的删除操作,导致记录版本链过长,其他事务来查询数据时,需要扫描很多的记录版本链,导致普通的查询都会变得非常慢!

5、解决问题

针对这种问题,直接将删除很多数据的长事务给 kill 掉就可以了

之后要避免在业务高峰期的时候运行大量删除数据的语句,放在业务低峰期去执行,比如凌晨,这样会好一些

这篇关于【MySQL进阶之路】千万级数据删除导致的慢查询SQL调优实战的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/712040

相关文章

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

MySQL常用字符串函数示例和场景介绍

《MySQL常用字符串函数示例和场景介绍》MySQL提供了丰富的字符串函数帮助我们高效地对字符串进行处理、转换和分析,本文我将全面且深入地介绍MySQL常用的字符串函数,并结合具体示例和场景,帮你熟练... 目录一、字符串函数概述1.1 字符串函数的作用1.2 字符串函数分类二、字符串长度与统计函数2.1

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

SQL Server跟踪自动统计信息更新实战指南

《SQLServer跟踪自动统计信息更新实战指南》本文详解SQLServer自动统计信息更新的跟踪方法,推荐使用扩展事件实时捕获更新操作及详细信息,同时结合系统视图快速检查统计信息状态,重点强调修... 目录SQL Server 如何跟踪自动统计信息更新:深入解析与实战指南 核心跟踪方法1️⃣ 利用系统目录

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)

《java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)》:本文主要介绍java中pdf模版填充表单踩坑的相关资料,OpenPDF、iText、PDFBox是三... 目录准备Pdf模版方法1:itextpdf7填充表单(1)加入依赖(2)代码(3)遇到的问题方法2:pd

Mysql中设计数据表的过程解析

《Mysql中设计数据表的过程解析》数据库约束通过NOTNULL、UNIQUE、DEFAULT、主键和外键等规则保障数据完整性,自动校验数据,减少人工错误,提升数据一致性和业务逻辑严谨性,本文介绍My... 目录1.引言2.NOT NULL——制定某列不可以存储NULL值2.UNIQUE——保证某一列的每一

解密SQL查询语句执行的过程

《解密SQL查询语句执行的过程》文章讲解了SQL语句的执行流程,涵盖解析、优化、执行三个核心阶段,并介绍执行计划查看方法EXPLAIN,同时提出性能优化技巧如合理使用索引、避免SELECT*、JOIN... 目录1. SQL语句的基本结构2. SQL语句的执行过程3. SQL语句的执行计划4. 常见的性能优

SQL Server 中的 WITH (NOLOCK) 示例详解

《SQLServer中的WITH(NOLOCK)示例详解》SQLServer中的WITH(NOLOCK)是一种表提示,等同于READUNCOMMITTED隔离级别,允许查询在不获取共享锁的情... 目录SQL Server 中的 WITH (NOLOCK) 详解一、WITH (NOLOCK) 的本质二、工作