一次mysql联表 join 后 order by desc 慢的排查

2024-02-02 21:10

本文主要是介绍一次mysql联表 join 后 order by desc 慢的排查,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、前言

因为项目需要进行数据量测试,查看项目相关指标在预期数量中是否正常,所以,其中一项就是数据库的数据量测试,发现项目在查询的时候非常的慢。

二、问题概述

1、一张用户表 sys_user_info,和问题相关的字段,主要有以下数据,因为用户表很少,目前为8条,所以,暂时未加索引。

字段说明
id主键
dept_id所属部门

在这里插入图片描述

2、一张工单表 work_order,和问题相关的字段和索引,主要有以下数据 ,其中数据为 290万条数据

字段说明
id主键
create_user_id工单创建人id,就是用户id
create_time创建时间
索引说明
idx_create_user_id主键
idx_create_time工单创建人id,就是用户id

在这里插入图片描述

3、现在的需求是不同用户只能看指定部门下人员的工单,而且前端在查询的时候,是有用户名称之类的查询条件的,所以,初步sql 如下

WITH sui AS ( SELECT id, dept_id, `name` FROM sys_user_info WHERE dept_id IN ( 用户可以看那些部门的id ) ) SELECTwo.*,( SELECT `name` FROM sys_user_info sui_1 WHERE sui_1.id = wo.create_user_id ) AS createUserName,sui.`name` AS dealUserName 
FROMwork_order woINNER JOIN sui ON wo.deal_user_id = sui.id 
ORDER BYwo.create_time DESC WHERE ......条件LIMIT 0,20

三、问题

1、我们执行以下一个简单的查询,在数据量少的时候,发现没有什么问题,但是在工单表290万数据之后就出现问题了,查询耗时近9秒,实在是离谱。

WITH sui AS ( SELECT id, dept_id, `name` FROM sys_user_info WHERE dept_id IN ( ( 3 ), ( 6 ), ( 7 ) ) ) SELECTwo.*,( SELECT `name` FROM sys_user_info sui_1 WHERE sui_1.id = wo.create_user_id ) AS createUserName,sui.`name` AS dealUserName 
FROMwork_order woINNER JOIN sui ON wo.deal_user_id = sui.id 
ORDER BYwo.create_time DESC LIMIT 0,20

在这里插入图片描述

2、经过我慢慢排查发现,就是一旦我们不使用时间排序,就会发现快的起飞(当然这也是我在关键字段上加上索引的缘故,后面我会统一说
在这里插入图片描述

四、方案

4.1、处理

1、第一步使用 explain show profiles 来查看自己的sql有没有问题,看看是不是自己预期的情况,是不是 innodb_buffer_pool_size大小的问题。可以看下这个 一次mysql order by desc 慢的排查,个人觉得是比较好的。但是,我这边这个值已经是 1G了,但是效果还是很不理想,所以我暂时排除了这个方案。
在这里插入图片描述

2、我使用 explain命令查看后,可以看到我们在使用时间字段排序的时候,rows是293万行?这就是很离谱了,这就说明为什么那么慢了,而且看到最后一行 filesort就知道,我们该优化这个Sql了。

这个为什么是293万,为什么会比工单表290万还大,那是因为我们使用join关联表,形成了笛卡儿积。所以,我们最好能把先过滤的表的数据形成一张子表后,再关联。

在这里插入图片描述

3、我们在注释时间排序后,发现只有50万左右的数据了,一下少了近 1/4。
在这里插入图片描述
4、所以我们得出,我们必须先让时间索引生效,在这里网上有一些不同的方式,如下

  • 使用关键字 straight_join 修改驱动表和被驱动表的位置 ,可以参考 MySQL中驱动表和被驱动表的解读,但是我个人是不建议改的,而且改完MySQL就不能根据实际情况更改了。
  • 使用 FORCE INDEX(索引名称) 来强制使用索引。

5、我这里就已第二种方式来处理,可以看到使用的日期索引,并且个数是19(从0开始)
在这里插入图片描述
6、再看下查询速度,还是很快的。
在这里插入图片描述

4.2、问题的原因

1、所以总结在使用 ORDER BY wo.create_time DESC 慢的原因

  • 如果我们不使用字段排序,那么使用inner join后 只需要获取第0页20条数据即可,也就是在189514条数据中找前面20条即可,所以会快很多。
  • 但如果我们使用时间字段排序,这个时候我们需要对inner join的结果进行排序,而排序字段索引又没有生效(使用的是filesort),所以就很慢了。
  • 至于排序字段的索引为什么不生效,我们先看下 为什么MySQL会使用 filesort,官方解释如下:

Using filesort:
MySQL must do an extra pass to find out how to retrieve the rows in sorted order. The sort is done by going through all rows according to the join type and storing the sort key and pointer to the row for all rows that match the WHERE clause.
Mysql需要额外的一次传递,以找出如何按排序顺序检索行,通过根据联接类型浏览所有行并为所有匹配where子句的行保存排序关键字和行的指针来完成排序,然后关键字被排序,并按排序顺序检索行。

这句话直接翻译过来有点难以理解,简单说就是由于索引不满足你的sql,mysql需要对数据行进行一次额外的排序操作,这个排序操作既费空间又费时间。当数据量较少的时候并不会对应用产生多大影响,但数据量一多,就会出现非常可怕的后果,轻则服务响应变慢,重则拖垮服务,甚至引发雪崩效应导致应用宕机。

再回来看看我的sql,查询列和搜索条件应该都没有问题,那么应该order by影响了。通过搜索发现,order by 使用不当确实会导致索引失效。

五、使用 order by后查询速度很慢的可能原因。

  • 由于数据库两张表的字段编码不一致导致的。
  • 由于Using filesort排序导致的。
  • 由于没有走索引导致的。
  • 使用组合索引排序时,使用的顺序不对,需要保证顺序。

这里说一点,我们在联表查询的时候,最好相关外键都加上索引,这样会快很多。

这篇关于一次mysql联表 join 后 order by desc 慢的排查的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/671955

相关文章

canal实现mysql数据同步的详细过程

《canal实现mysql数据同步的详细过程》:本文主要介绍canal实现mysql数据同步的详细过程,本文通过实例图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的... 目录1、canal下载2、mysql同步用户创建和授权3、canal admin安装和启动4、canal

SpringBoot排查和解决JSON解析错误(400 Bad Request)的方法

《SpringBoot排查和解决JSON解析错误(400BadRequest)的方法》在开发SpringBootRESTfulAPI时,客户端与服务端的数据交互通常使用JSON格式,然而,JSON... 目录问题背景1. 问题描述2. 错误分析解决方案1. 手动重新输入jsON2. 使用工具清理JSON3.

SQL中JOIN操作的条件使用总结与实践

《SQL中JOIN操作的条件使用总结与实践》在SQL查询中,JOIN操作是多表关联的核心工具,本文将从原理,场景和最佳实践三个方面总结JOIN条件的使用规则,希望可以帮助开发者精准控制查询逻辑... 目录一、ON与WHERE的本质区别二、场景化条件使用规则三、最佳实践建议1.优先使用ON条件2.WHERE用

MySQL存储过程之循环遍历查询的结果集详解

《MySQL存储过程之循环遍历查询的结果集详解》:本文主要介绍MySQL存储过程之循环遍历查询的结果集,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言1. 表结构2. 存储过程3. 关于存储过程的SQL补充总结前言近来碰到这样一个问题:在生产上导入的数据发现

MySQL 衍生表(Derived Tables)的使用

《MySQL衍生表(DerivedTables)的使用》本文主要介绍了MySQL衍生表(DerivedTables)的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学... 目录一、衍生表简介1.1 衍生表基本用法1.2 自定义列名1.3 衍生表的局限在SQL的查询语句select

MySQL 横向衍生表(Lateral Derived Tables)的实现

《MySQL横向衍生表(LateralDerivedTables)的实现》横向衍生表适用于在需要通过子查询获取中间结果集的场景,相对于普通衍生表,横向衍生表可以引用在其之前出现过的表名,本文就来... 目录一、横向衍生表用法示例1.1 用法示例1.2 使用建议前面我们介绍过mysql中的衍生表(From子句

Mybatis Plus Join使用方法示例详解

《MybatisPlusJoin使用方法示例详解》:本文主要介绍MybatisPlusJoin使用方法示例详解,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,... 目录1、pom文件2、yaml配置文件3、分页插件4、示例代码:5、测试代码6、和PageHelper结合6

六个案例搞懂mysql间隙锁

《六个案例搞懂mysql间隙锁》MySQL中的间隙是指索引中两个索引键之间的空间,间隙锁用于防止范围查询期间的幻读,本文主要介绍了六个案例搞懂mysql间隙锁,具有一定的参考价值,感兴趣的可以了解一下... 目录概念解释间隙锁详解间隙锁触发条件间隙锁加锁规则案例演示案例一:唯一索引等值锁定存在的数据案例二:

MySQL JSON 查询中的对象与数组技巧及查询示例

《MySQLJSON查询中的对象与数组技巧及查询示例》MySQL中JSON对象和JSON数组查询的详细介绍及带有WHERE条件的查询示例,本文给大家介绍的非常详细,mysqljson查询示例相关知... 目录jsON 对象查询1. JSON_CONTAINS2. JSON_EXTRACT3. JSON_TA

MySQL 设置AUTO_INCREMENT 无效的问题解决

《MySQL设置AUTO_INCREMENT无效的问题解决》本文主要介绍了MySQL设置AUTO_INCREMENT无效的问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参... 目录快速设置mysql的auto_increment参数一、修改 AUTO_INCREMENT 的值。