Mysql索引下推、Order by优化和Using filesort文件排序原理

本文主要是介绍Mysql索引下推、Order by优化和Using filesort文件排序原理，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

1、like 'KK%' 和索引下推

2、Order by 和 Group by 优化

3、Using filesort文件排序原理

// 以下建表结构和数据同《Mysql explain 索引优化案例》

1、like 'KK%' 和索引下推

like 'KK%' 一般情况都会走索引，原因是like 'KK%' 用到了索引下推优化

EXPLAIN SELECT * FROM employees WHERE name like 'LiLei%' AND age = 22 AND position ='manager';

什么是索引下推？

对于辅助的联合索引(name,age,position)，正常情况按照最左前缀原则：WHERE name like 'LiLei%' AND age = 22 AND position ='manager'; 这种情况只会走name字段索引，因为根据name字段过滤完，得到的索引行里的age和position是无序的，无法很好的利用索引。

在MySQL5.6之前的版本，这个查询只能在联合索引里匹配到名字是 'LiLei' 开头的索引，然后拿这些索引对应的主键逐个回表，到主键索引上找出相应的记录，再比对age和position这两个字段的值是否符合。

MySQL 5.6引入了索引下推优化，可以在索引遍历过程中，对索引中包含的所有字段先做判断，过滤掉不符合条件的记录之后再回表，可以有效的减少回表次数。使用了索引下推优化后，上面那个查询在联合索引里匹配到名字是 'LiLei' 开头的索引之后，同时还会在索引里过滤age和position这两个字段，拿着过滤完剩下的索引对应的主键id再回表查整行数据。

索引下推会减少回表次数，对于innodb引擎的表索引下推只能用于二级索引，innodb的主键索引(聚簇索引)树叶子节点上保存的是全行数据，所以这个时候索引下推并不会起到减少查询全行数据的效果。

2、Order by 和 Group by 优化

案例一

EXPLAIN SELECT * FROM employees WHERE name like 'LiLei%' AND position ='dev' order by age;

分析：利用最左前缀法则：中间字段不能断，因此查询用到了name索引，从key_len=74也能看出，age索引列用在排序过程中，因为Extra字段里没有using filesort

案例二

EXPLAIN SELECT * FROM employees WHERE name like 'LiLei%' order by position;

分析：从explain的执行结果来看，key_len=74，查询使用了name索引，由于用了position进行排序，跳过了 age，出现了Using filesort

案例三

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' order by age, position;

分析：查找只用到索引name，age和position用于排序，无Using filesort

案例四

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' order by position, age;

分析：和案例三中explain的执行结果一样，但是出现了Using filesort，因为索引的创建顺序为

name，age，position，但是排序的时候age和position颠倒位置了。

案例五

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' and age = 18 order by position, age;

分析：与案例四对比，在Extra中并未出现Using filesort，因为age为常量(已经被锁定)，在排序中被优化，所以索引未颠倒，不会出现Using filesort。//实际上age没有参与排序

案例六

EXPLAIN SELECT * FROM employees WHERE name = 'LiLei' order by age asc, position desc;

分析：虽然排序的字段列与索引顺序一样，且order by默认升序，这里position desc变成了降序，导致与索引的排序方式不同，从而产生Using filesort。Mysql8以上版本有降序索引可以支持该种查询方式。

案例七

EXPLAIN SELECT * FROM employees WHERE name in ('LiLei','XiaoHong') order by age, position;

分析：对于排序来说，多个相等条件也是范围查询，通过name范围查询的结果，age和position不是有序的，因此排序一定会出现Using filesort

案例八

EXPLAIN SELECT * FROM employees WHERE name > 'a' order by name;

应该走索引的sql为什么最终全表扫描呢？select * 的字段最终会导致回表，所以Mysql优化分析的结果是，走索引效率上并不一定比全表扫描高。

使用覆盖索引进行优化

EXPLAIN SELECT name, age, position FROM employees WHERE name > 'a' order by name;

优化总结：

（1）MySQL支持两种方式的排序 filesort 和 index，Using index是指MySQL扫描索引本身完成排序。index 效率高，filesort效率低(内存排序/磁盘排序)。

（2）order by满足两种情况会使用Using index。

order by语句使用索引最左前列
使用where子句与order by子句条件列组合满足索引最左前列

（3）尽量在索引列上完成排序，遵循索引建立(索引创建的顺序)时的最左前缀法则，如果order by的条件不在索引列上，就会产生Using filesort

（4）能用覆盖索引尽量用覆盖索引

（5）group by与order by很类似，其实质是先排序后分组，遵照索引创建顺序的最左前缀法则。对于group by的优化如果不需要排序的可以加上order by null 禁止排序。注意，where高于having，能写在where中的限定条件就不要去having限定了。

3、Using filesort文件排序原理

filesort 文件排序方式

（1）单路排序：是一次性取出满足条件行的所有字段，然后在sort buffer中进行排序

用trace工具可以看到sort_mode信息里显示：< sort_key, additional_fields >或者< sort_key,packed_additional_fields >

（2）双路排序(又叫回表排序模式)：是首先根据相应的条件取出相应的排序字段和可以直接定位行数据的行 ID，然后在 sort buffer 中进行排序，排序完后需要再次取回其它需要的字段；

用trace工具可以看到sort_mode信息里显示：< sort_key, rowid >

MySQL 通过比较系统变量 max_length_for_sort_data (默认1024字节) 的大小和需要查询的字段总大小来判断使用哪种排序模式。

如果字段的总长度小于max_length_for_sort_data ，那么使用单路排序模式；
如果字段的总长度大于max_length_for_sort_data ，那么使用双路排序模式。

对比两个排序模式：

单路排序会把所有需要查询的字段都放到 sort buffer 中，而双路排序只会把主键和需要排序的字段放到 sort buffer 中进行排序，然后再通过主键回到原表查询需要的字段。

如果 MySQL 排序内存 sort_buffer 配置的比较小，可以适当把 max_length_for_sort_data 配置小点，让优化器选择使用双路排序算法，可以在sort_buffer 中一次排序更多的行，只是需要再根据主键回到原表取数据。
如果 MySQL 排序内存配置比较大，可以适当增大 max_length_for_sort_data 的值，让优化器优先选择全字段排序(单路排序)，把需要的字段放到 sort_buffer 中，这样排序后就会直接从内存里返回查询结果了。

所以，MySQL通过 max_length_for_sort_data 这个参数来控制排序，在不同场景使用不同的排序模式，从而提升排序效率。

注意，如果全部使用sort_buffer内存排序一般情况下效率会高于磁盘文件排序，但不能因为这个就随便增大sort_buffer(默认1M)，mysql很多参数设置都做过优化，不要轻易调整。

这篇关于Mysql索引下推、Order by优化和Using filesort文件排序原理的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！