简析联合索引、覆盖索引、MRR优化、ICP优化

2023-10-09 10:38

本文主要是介绍简析联合索引、覆盖索引、MRR优化、ICP优化,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

简析联合索引、覆盖索引、MRR优化、ICP优化

    • 联合索引
    • 覆盖索引
    • 优化器选择不使用索引的情况
    • Multi-Range Read(MRR)优化
    • Index Condition Pushdown(ICP)优化

联合索引

与建立单个索引的方式相同,不过联合索引有多个索引列,且不同的列有严格的先后顺序

联合索引

如图所示,为一个由两个整形列组成的联合索引的索引结构。同单个键值的索引一样,联合索引的键值也在叶子节点上排序,按照第一个列为主要关键字,第二个列为次要关键字的顺序。这样的顺序就决定了联合索引查找的“最左匹配”原则。

SELECT * FROM TABLE WHERE a=xxx and b=xxx;

这样的查询语句完美匹配了联合索引。

SELECT * FROM TABLE WHERE a=xxx ;

这个查询虽然不完全匹配,但通过观察发现,联合索引中已经按照a列进行了排序(a为主要关键字),已经满足了这次查询需要的索引,因此这次查询也会使用联合索引。

SELECT * FROM TABLE WHERE b=xxx ;

虽然b也在联合索引之中,但是b并不是主要关键字,实际的顺序是先按照a排序,再按照b排序的,要想直接查询b,在这个索引中是无法绕开a的,也就是说这些全部数据对于b来说是无序的,因此不可以使用联合索引。

同样,对于需要对a查找,并将结果对b排序,也适用联合索引

SELECT * FROM TABLE WHERE a=xxx ORDER BY b ;

知道了两列的联合索引后,更多列的联合索引的原理也是同理。

例如,建立联合索引(a,b,c),下面的查询并不会直接得出结果

SELECT * FROM TABLE WHERE a=xxx ORDER BY c ;

因为逻辑顺序是先按照a列排序,再按照b列排序,再按照c列排序,因此查找a后得到的结果首先是按照b排序的,并不是按照c排序的。这正是最左匹配原则。

覆盖索引

覆盖索引,又称为索引覆盖。在辅助索引的叶子节点上保存着键值和书签,通常我们需要拿到书签后再用聚集索引查到数据。如果我们需要的数据恰好就是辅助索引叶子节点上保存的键值,那么书签就没用了,不需要再用聚集索引去查找了,这就成为覆盖索引。这有一个好处,辅助索引不包含整行记录,所占空间极小,所以相比聚集索引可以减少大量的IO操作,节省时间。

另一方面,在使用聚合函数查询,例如统计总数时,也会进行覆盖索引。同理,因为它不需要知道详细数据,仅从辅助索引就可以得到答案,而且辅助索引的IO操作更少。

此外,通常情况下,对于(a,b)的联合索引,是不可以跳过a,直接选择b进行查询的,因为并不是按照b来排序的。但是对于b的统计操作,只需要数量而不需要内容的情况下,虽然选择联合索引与否,都需要全部扫描,但是相对聚集索引来说,使用该联合索引可以利用到覆盖索引,从而在满足要求的前提下减少IO操作。

优化器选择不使用索引的情况

这种情况多发生于范围查找、JOIN链接操作等情况。下面举一个范围查找的例子。

SELECT * FROM t WHERE orderid>10000 and orderid<102000;

表t建立了对于列OrderID的辅助索引。显然,该查询可以利用这个辅助索引快速定位到需要查询的行数据。

然而实际上,查询优化器并没有使用这个索引。

查询优化器使用了聚集索引,也就是表扫描。

原因在于,辅助索引的叶子节点保存的只是键值和书签,该查询查的是整行,并不能利用覆盖索引,所以,虽然辅助索引中找到书签的速度很快,但利用这些书签去聚集索引中找到全部数据的过程将会非常漫长。因为这个过程是无序的,只能一次一次查找,变成了磁盘上的离散读。如果查询的数据数量很少,还是可以使用辅助索引的,但此查询数据量极大(20%左右),还不如全表扫描(顺序读要远远快于离散读)。

Multi-Range Read(MRR)优化

MySQL5.6版本开始支持MRR优化。主要目的是为了减少对磁盘的随机访问,将其转化为较为顺序的数据访问。适用于range,ref,eq_ref类型的查询。

有如下几个好处

  • 使数据访问变得较为顺序。辅助索引查询得到书签后,先对主键进行排序,再按序进行查找
  • 减少缓冲池中页被替换的次数
  • 批量处理对键值的查询操作

具体操作步骤如下

  1. 先把查询到的辅助索引键值放在缓存中(此时是自然的按照辅助索引键值排序的)
  2. 将这些键值按照主键进行排序
  3. 将排序后的主键使用聚集索引查找

此外,如果缓冲池不够大,在查找某一条时,读进该页,这页会很快被移出缓冲池。如果查找是没有顺序的,可能这页被移除后,很快又要被读进来。这样对同一页反复移入移出,会有很大的消耗。而如果查找是有顺序的,将会极大地避免这种情况。

MRR还可以将某些范围查询,拆分为键值对,以此来进行批量数据查询。这样可以在拆分过程中,直接过滤掉一些不符合查询条件的数据。例如:

SELECT * FROM t WHERE a>=1000 AND a<2000 AND b =1000;

表中建有(a,b)的联合索引。如果没有MRR优化,优化器将会先把满足a>=1000 AND a<2000的所有数据取出,待到取出完后再根据 b =1000的条件进行过滤。这样会使很多无用数据被取出,如果无用数据数量很多,将会浪费很多时间。

启用了MRR优化后,优化器先将查询条件拆分,(1000,1000)(1001,1000)(1002,1000)……根据这些条件进行查询,这样取出的数据就都是有用的数据了。

Index Condition Pushdown(ICP)优化

ICP也是MySQL5.6后开始支持的一种根据索引进行查询的优化方式。以往,我们会根据索引查找记录,再根据WHERE条件来过滤记录。使用ICP优化后,会在取出索引的同时,直接根据WHERE条件过滤,将WHERE的部分过滤操作放在了存储引擎层。在某些查询下可以大大减少上层SQL层对记录的索取,从而提高性能。

例如:

SELECT * FROM t WHERE a=2000 AND b LIKE '%street%';

这张表有联合索引(a,b),如果没有ICP优化,会通过索引找到并取出a=2000的记录后,再过滤WHERE的另一个条件,因为索引对b LIKE '%street%'这个条件并没有任何帮助作用。如果使用了ICP优化,就会在找到索引后,直接进行WHERE条件的过滤(因为这个是联合索引,索引中也有关于列b的值),然后再去获取记录。这将极大的提高查询效率。

同理,如果要查询的两个条件中,一个建立了辅助索引,另一个是聚集索引,也可以使用ICP优化,因为辅助索引的叶子节点中也有聚集索引键(书签)。


参考《MySQL技术内幕:InnoDB存储引擎》

这篇关于简析联合索引、覆盖索引、MRR优化、ICP优化的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/172249

相关文章

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

Python实战之SEO优化自动化工具开发指南

《Python实战之SEO优化自动化工具开发指南》在数字化营销时代,搜索引擎优化(SEO)已成为网站获取流量的重要手段,本文将带您使用Python开发一套完整的SEO自动化工具,需要的可以了解下... 目录前言项目概述技术栈选择核心模块实现1. 关键词研究模块2. 网站技术seo检测模块3. 内容优化分析模

Java实现复杂查询优化的7个技巧小结

《Java实现复杂查询优化的7个技巧小结》在Java项目中,复杂查询是开发者面临的“硬骨头”,本文将通过7个实战技巧,结合代码示例和性能对比,手把手教你如何让复杂查询变得优雅,大家可以根据需求进行选择... 目录一、复杂查询的痛点:为何你的代码“又臭又长”1.1冗余变量与中间状态1.2重复查询与性能陷阱1.

Python内存优化的实战技巧分享

《Python内存优化的实战技巧分享》Python作为一门解释型语言,虽然在开发效率上有着显著优势,但在执行效率方面往往被诟病,然而,通过合理的内存优化策略,我们可以让Python程序的运行速度提升3... 目录前言python内存管理机制引用计数机制垃圾回收机制内存泄漏的常见原因1. 循环引用2. 全局变

Python多线程应用中的卡死问题优化方案指南

《Python多线程应用中的卡死问题优化方案指南》在利用Python语言开发某查询软件时,遇到了点击搜索按钮后软件卡死的问题,本文将简单分析一下出现的原因以及对应的优化方案,希望对大家有所帮助... 目录问题描述优化方案1. 网络请求优化2. 多线程架构优化3. 全局异常处理4. 配置管理优化优化效果1.

MySQL中优化CPU使用的详细指南

《MySQL中优化CPU使用的详细指南》优化MySQL的CPU使用可以显著提高数据库的性能和响应时间,本文为大家整理了一些优化CPU使用的方法,大家可以根据需要进行选择... 目录一、优化查询和索引1.1 优化查询语句1.2 创建和优化索引1.3 避免全表扫描二、调整mysql配置参数2.1 调整线程数2.

深入解析Java NIO在高并发场景下的性能优化实践指南

《深入解析JavaNIO在高并发场景下的性能优化实践指南》随着互联网业务不断演进,对高并发、低延时网络服务的需求日益增长,本文将深入解析JavaNIO在高并发场景下的性能优化方法,希望对大家有所帮助... 目录简介一、技术背景与应用场景二、核心原理深入分析2.1 Selector多路复用2.2 Buffer

SpringBoot利用树形结构优化查询速度

《SpringBoot利用树形结构优化查询速度》这篇文章主要为大家详细介绍了SpringBoot利用树形结构优化查询速度,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一个真实的性能灾难传统方案为什么这么慢N+1查询灾难性能测试数据对比核心解决方案:一次查询 + O(n)算法解决

C语言自定义类型之联合和枚举解读

《C语言自定义类型之联合和枚举解读》联合体共享内存,大小由最大成员决定,遵循对齐规则;枚举类型列举可能值,提升可读性和类型安全性,两者在C语言中用于优化内存和程序效率... 目录一、联合体1.1 联合体类型的声明1.2 联合体的特点1.2.1 特点11.2.2 特点21.2.3 特点31.3 联合体的大小1

MySQL 索引简介及常见的索引类型有哪些

《MySQL索引简介及常见的索引类型有哪些》MySQL索引是加速数据检索的特殊结构,用于存储列值与位置信息,常见的索引类型包括:主键索引、唯一索引、普通索引、复合索引、全文索引和空间索引等,本文介绍... 目录什么是 mysql 的索引?常见的索引类型有哪些?总结性回答详细解释1. MySQL 索引的概念2