明明白白告诉你MySQL索引效率分析和使用原则

本文主要是介绍明明白白告诉你MySQL索引效率分析和使用原则,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

MySQL索引分析语句和使用

explain分析语句

EXPLAIN语句的基本语法如下:

EXPLAIN [EXTENDED] SELECT select_options

使用EXTENED关键字,EXPLAIN语句将产生附加信息。select_options 是SELECT语句的查询选项,包括FROM WHERE子句等。

执行该语句,可以分析EXPLAIN后面的SELECT语句的执行情况,并且能够分析出所查 询的表的一些特征。

使用EXPLAIN语句来分析1个查询语句,执行如下语句:

下面我们对查询结果进行解释:

字段描述
idselect识别符。这是select的查询序列号,id的值越大优先级别越高,越先被执行,如果id相同,执行顺序右上至下
select_typeselect_type表示select语句的类型。
tabletype表示这一行的数据是关于哪张表的。
partitions
typetype表示的是表的连接类型。
possible_keyspossible_keys列支出mysql能使用哪个索引在该表中找到行。如果这列是null,则没有相关的索引。在这种情况下,可以通过检查where子句查看它是否引用某些列或者适合索引的列来提高查询性能。如果是这样,可以创建适合的索引来提高查询的性能
keykey表示查询实际应用到的索引,如果没有选择索引,该列的值是null。想要强制使mysql使用或者忽视possible_type列中的索引,在查询中使用force index,use index 或者 ignore index。
key_lenkey_len表示mysql选择的索引字段按字节计算的长度,如果键是null,则长度为null,注意通过key_len值可以确定mysql将实际使用一个多列索引中的几个字段
refref表示使用哪个列或常数与索引一起来查询记录
rowsrows显示mysql表中进行查询时必须检查的行数
filtered通过查询条件获取的最终记录行数 占 通过type字段指明的搜索方式搜索出来的记录行数的百分比
Extraextra显示mysql在处理查询时的详细信息。

性能判定依据主要字段信息不同值的解释:

select_type

(1) SIMPLE

SIMPLE表示简单查询,其中不包括连接查询和子查询。

(2) PRIMARY与SUBQUERY

PRIMARY表示主查询或者最外层的查询语句。SUBQUERY : 子查询

 (3) DERIVED: 衍生查询-在select出一批自定义列的数据,概念上相当于一张表

(4) UNION 与 UNION RESULT

UNION :联合查询,union 后面的那张表就会表示成它

UNION RESULT:  联合结果

type

对表访问方式,表示MySQL在表中找到所需行的方式,又称“访问类型”。

常用的类型有: ALL、index、range、 ref、eq_ref、const、system、NULL(从左到右,性能从差到好)

ALL:Full Table Scan, MySQL将遍历全表以找到匹配的行

index: Full Index Scan,index与ALL区别为index类型只遍历索引树

range:只检索给定范围的行,使用一个索引来选择行

ref: 表示上述表的连接匹配条件,即哪些列或常量被用于查找索引列上的值

eq_ref: 类似ref,区别就在使用的索引是唯一索引,对于每个索引键值,表中只有一条记录匹配,简单来说,就是多表连接中使用primary key或者 unique key作为关联条件

const、system: 当MySQL对查询某部分进行优化,并转换为一个常量时,使用这些类型访问。如将主键置于where列表中,MySQL就能将该查询转换为一个常量,system是const类型的特例,当查询的表只有一行的情况下,使用system

NULL: MySQL在优化过程中分解语句,执行时甚至不用访问表或索引,例如从一个索引列里选取最小值可以通过单独索引查找完成。

Extar

Extra列是用来说明一些额外信息的,我们可以通过这些额外信息来更准确的理解MySQL到底将如何执行给定的查询语句。MySQL提供的额外信息有好几十个,就不一个一个介绍了,在这只介绍常见的一些额外信息说明 .

1, Using filesort: 如果根据索引列进行排序(order by 索引列)是可以用到索引的,SQL查询引擎会先根据索引列进行排序,然后获取对应记录的主键id执行回表操作,如果排序字段用不到索引则只能在内存中或磁盘中进行排序操作,MySQL把这种在内存或者磁盘上进行排序的方式统称为文件排序(英文名:filesort),如果某个查询需要使用文件排序的方式执行查询,就会在执行计划的Extra列中显示Using filesort

2, Using temporary: 许多查询的执行过程中,MySQL会借助临时表来完成一些功能,比如去重、排序之类的,比如我们在执行许多包含distinct、group by、union等子句的查询过程中,如果不能有效利用索引来完成查询,MySQL很有可能寻求通过建立内部的临时表来执行查询。如果查询中使用到了内部的临时表,在执行计划的Extra列将会显示Using temporary提示.

3, USING index: 表示相应的select操作中使用了覆盖索引(Covering Index),避免回表操作,效率不错!

如果同时出现using where,表明索引被用来执行索引键值的查找;如果没有同时出现using where,表名索引用来读取数据而非执行查找动作。

4, Using where: 使用了where过滤

5, using join buffer: 在连接查询执行过程中,当被驱动表不能有效的利用索引加快访问速度,MySQL一般会为其分配一块名叫join buffer的内存块来加快查询速度

6, impossible where: where子句的值总是false,不能用来获取任何元组

7, select tables optimized away: 在没有GROUPBY子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。

8, distinct: 优化distinct,在找到第一匹配的元组后即停止找同样值的工作

9, Using index condition:查找使用了索引,但是需要回表查询数据

MySQL索引效率分析

查询效率大概的顺序为:

USING index 查询效率最高

Using where;USING index; 次于覆盖索引,使用了where过滤和索引查询

Using where 使用了where过滤

Using index condition; 使用了索引,但是要回表查询数据

Using filesort | Using temporary (两个差不多同级,效率都不高)

关于 Using where 和 Using where;USING index 的效率比较:

我网上看到有人说Using where 比 Using where;USING index 效率要高,我不能理解,但作为求真精神,所以我自己进行压测。

sql语句

SELECT a.id,a.`host` FROM (select id,`host` FROM eju_static_url WHERE id >= 6053) a WHERE a.`host`='sh.zhilaowang.com';

压测语句

mysqlslap --no-defaults -h 127.0.0.1 -u root -p123456 -c 10 -i 1 --create-schema test -q "SELECT a.id,a.`host` FROM (select id,`host` FROM eju_static_url WHERE id >= 6053) a WHERE a.`host`='sh.zhilaowang.com'" -e innodb --number-of-queries=100

Using where

在没有给host字段添加索引的时候,explain的extra就是 Using where

压测结果

Using where;USING index

给host添加索引后,explain的extra就是 Using where; Using index

 压测结果

关于 Using where 和 Using index condition 的效率比较:

 Using index condition是需要进行回表查询的,那么与不需要回表的Using where对比,是不是性能更差呢?网上说是,自己写代码验证一下

sql语句

SELECT action FROM eju_static_url WHERE `host`='sh.zhilaowang.com' AND id >= 2000;

压测语句

mysqlslap --no-defaults -h 127.0.0.1 -u root -p123456 -c 10 -i 1 --create-schema test -q "SELECT action FROM eju_static_url WHERE `host`='sh.zhilaowang.com' AND id >= 2000" -e innodb --number-of-queries=100

Using where

在没有给host字段添加索引的时候,explain的extra就是 Using where

压测结果

 Using index condition

给host添加索引后,explain的extra就是Using index condition

压测结果

 也就是说,索引不是随随便便都可以加的,如果没有加正确或者使用正确,可能数据库查询的效率会更慢。同时也得出结论:索引回表查询(相当于查询了两次)比直接表查询(只查询一次)更慢。

正确的操作是:把等式搜索的条件字段和搜索结果尽可能都制作成联合索引

索引使用原则

索引最左原则

查询语句执行时的最左原则

where > group by > order by

where条件最左原则

查询语句的where左右先后顺序会影响查询效率的高低,MySQL会优先查询where最左边的内容后筛选右边的内容,排序从两方面综合判定:

索引顺序:主键>唯一主键>普通主键>无索引

范围顺序:等号>in>范围(大于小于,between,like)

 实践

测试sql语句

SELECT action FROM eju_static_url WHERE version >= 2000 AND `host`='sh.zhilaowang.com';

SELECT action FROM eju_static_url WHERE `host`='sh.zhilaowang.com' and version >= 2000;

压测结果

我们可以看到,在都无索引的情况下,是等式的条件排在最左边的时候,比排在右边时效率更高

like模糊查询最左原则

模糊查询时,能不能确定左边的内容,也会影响查询的效率,如果能确定左边的内容,其实是可以使用到索引的。

 可以看到同一个搜索语句在搜索结果差不多的情况下,最左确定的情况下效率更高一些

联合索引生成时的最左原则

创建联合索引为【a,b,c,d】,那么查询where可以被联合索引匹配的字段的组合方式有【a】【a,b】【a,b,c】【a,b,c,d】,其他的如【a,c】【a,c,d】等非从左顺序组合的查询,都不会使用到索引,具体逻辑看检索索引btree顺序的最左原则

检索索引btree顺序的最左原则

在MySQL建立联合索引时会遵守最左前缀匹配原则,即最左优先,在检索数据时从联合索引的最左边开始匹配

如:创建一个(a,b)的联合索引,那么它的索引树就是下图的样子。

 可以看到a的值是有顺序的,1,1,2,2,3,3,而b的值是没有顺序的1,2,1,4,1,2。但是我们又可发现a在等值的情况下,b值又是按顺序排列的,但是这种顺序是相对的。这是因为MySQL创建联合索引的规则是首先会对联合索引的最左边第一个字段排序,在第一个字段的排序基础上,然后在对第二个字段进行排序。所以b=2这种查询条件没有办法利用索引。

规范使用原则

1. 唯一字段可以建立单索引,如手机号码、身份证号,非唯一字段可以考虑建立联合索引【索引字段的选择:一般会选择推荐重复比较少的字段 ,如果是项目需求,(可以考虑联合索引)】;

2. 索引的个数与包含的字段,最佳是不超出6个,勉强可以是10个,如果超过的话,就建议水平分表(减少索引字段)或垂直分表(减少数据量);

3. 索引的使用遵循最左匹配原则其次就是覆盖索引

4. 索引的选择字段尽量要小一些 int varchar(10) char(5) es 存储文本路径

5. 避免 like between 等范围查询

6. 尽量多使用explain进行分析

7. 优先考虑建立联合索引,索引的字段不要包含null 或者是 '';

 

 

 

 

这篇关于明明白白告诉你MySQL索引效率分析和使用原则的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/820460

相关文章

慢sql提前分析预警和动态sql替换-Mybatis-SQL

《慢sql提前分析预警和动态sql替换-Mybatis-SQL》为防止慢SQL问题而开发的MyBatis组件,该组件能够在开发、测试阶段自动分析SQL语句,并在出现慢SQL问题时通过Ducc配置实现动... 目录背景解决思路开源方案调研设计方案详细设计使用方法1、引入依赖jar包2、配置组件XML3、核心配

Git可视化管理工具(SourceTree)使用操作大全经典

《Git可视化管理工具(SourceTree)使用操作大全经典》本文详细介绍了SourceTree作为Git可视化管理工具的常用操作,包括连接远程仓库、添加SSH密钥、克隆仓库、设置默认项目目录、代码... 目录前言:连接Gitee or github,获取代码:在SourceTree中添加SSH密钥:Cl

Java NoClassDefFoundError运行时错误分析解决

《JavaNoClassDefFoundError运行时错误分析解决》在Java开发中,NoClassDefFoundError是一种常见的运行时错误,它通常表明Java虚拟机在尝试加载一个类时未能... 目录前言一、问题分析二、报错原因三、解决思路检查类路径配置检查依赖库检查类文件调试类加载器问题四、常见

MySQL数据库约束深入详解

《MySQL数据库约束深入详解》:本文主要介绍MySQL数据库约束,在MySQL数据库中,约束是用来限制进入表中的数据类型的一种技术,通过使用约束,可以确保数据的准确性、完整性和可靠性,需要的朋友... 目录一、数据库约束的概念二、约束类型三、NOT NULL 非空约束四、DEFAULT 默认值约束五、UN

Python中模块graphviz使用入门

《Python中模块graphviz使用入门》graphviz是一个用于创建和操作图形的Python库,本文主要介绍了Python中模块graphviz使用入门,具有一定的参考价值,感兴趣的可以了解一... 目录1.安装2. 基本用法2.1 输出图像格式2.2 图像style设置2.3 属性2.4 子图和聚

windows和Linux使用命令行计算文件的MD5值

《windows和Linux使用命令行计算文件的MD5值》在Windows和Linux系统中,您可以使用命令行(终端或命令提示符)来计算文件的MD5值,文章介绍了在Windows和Linux/macO... 目录在Windows上:在linux或MACOS上:总结在Windows上:可以使用certuti

CentOS和Ubuntu系统使用shell脚本创建用户和设置密码

《CentOS和Ubuntu系统使用shell脚本创建用户和设置密码》在Linux系统中,你可以使用useradd命令来创建新用户,使用echo和chpasswd命令来设置密码,本文写了一个shell... 在linux系统中,你可以使用useradd命令来创建新用户,使用echo和chpasswd命令来设

Python使用Matplotlib绘制3D曲面图详解

《Python使用Matplotlib绘制3D曲面图详解》:本文主要介绍Python使用Matplotlib绘制3D曲面图,在Python中,使用Matplotlib库绘制3D曲面图可以通过mpl... 目录准备工作绘制简单的 3D 曲面图绘制 3D 曲面图添加线框和透明度控制图形视角Matplotlib

Pandas中统计汇总可视化函数plot()的使用

《Pandas中统计汇总可视化函数plot()的使用》Pandas提供了许多强大的数据处理和分析功能,其中plot()函数就是其可视化功能的一个重要组成部分,本文主要介绍了Pandas中统计汇总可视化... 目录一、plot()函数简介二、plot()函数的基本用法三、plot()函数的参数详解四、使用pl

MySQL 多表连接操作方法(INNER JOIN、LEFT JOIN、RIGHT JOIN、FULL OUTER JOIN)

《MySQL多表连接操作方法(INNERJOIN、LEFTJOIN、RIGHTJOIN、FULLOUTERJOIN)》多表连接是一种将两个或多个表中的数据组合在一起的SQL操作,通过连接,... 目录一、 什么是多表连接?二、 mysql 支持的连接类型三、 多表连接的语法四、实战示例 数据准备五、连接的性