【直播笔记0505】涛哥的Mysql索引原理深入剖析

2024-03-21 00:50

本文主要是介绍【直播笔记0505】涛哥的Mysql索引原理深入剖析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

涛哥的Mysql索引原理深入剖析

  • 1. 索引到底是什么东西?
  • 2. 建立索引的方式
  • 3. 索引的类型:
  • 4. 数据结构选型
    • 4.1 二叉查找树
    • 4.1 平衡二叉树(AVL树)
    • B树
    • B+树
    • Hash索引
  • 存储引擎
  • 5.索引的使用以及创建
    • 索引的使用原则
    • 失效的场景

1.Mysql索引的本质是什么?
2.索引有哪些分类
3.为什么我们要选择B+树做为索引的数据结构
4.不同的存储引擎之间有什么差异
5.索引的使用到底应该遵循什么原则

创建索引效率提高。
键索引花费时间。

1. 索引到底是什么东西?

数据库的索引是i一个经过排序数据结构

目的:他就是为了让你的查询更快

只要是数据结构 必然会占用你的空间。
典型的空间换时间思想。

索引: KV形式

K:字段的值
V:地址指针
在这里插入图片描述

2. 建立索引的方式

建表的时候
通过sql语句
通过可视化界面

3. 索引的类型:

普通索引:就是经过特殊设计的数据结构
唯一索引:值不能重复
主键索引(特殊的唯一索引): 非空约束

全文索引:full text 全文匹配 对中文分词不太好,业务中推荐使用搜索引擎。

最左前缀原则

4. 数据结构选型

有序的数据结构 树 单链表 有序数组
有序数组:新增数据不方便,大量数据比对和角标移动.不适合修改比较多的这个场景

单链表:查询效率低,要把前面的每个格子都要查一遍

那种数据结构合适?
首先有序,支持二分查找法,

4.1 二叉查找树

在这里插入图片描述
但是有个问题: 最坏情况,会存在一条链表,无法进行二分查找。
在这里插入图片描述

4.1 平衡二叉树(AVL树)

改进后,会有平衡二叉树
在这里插入图片描述
会存在旋转
节点指向改变
在这里插入图片描述
在这里插入图片描述
假设使用avl作为索引的话,会存储四个值(kv,左右孩子)
在这里插入图片描述
放不了多少。
一个磁盘块存放多个数据。

B树

二叉变为多叉。
减少io次数,不管前中后序都会回到父节点。
查询效率不稳定,可能查到父节点,也可能查到子节点。
在这里插入图片描述
关键字越小 同一个磁盘块容纳的关键字越多

B+树

在叶子节点上 才会存储数据
叶子节点间也有指针。
三个特性:减少io次数,磁盘读写能力更强,效率会更加稳定(查的都是子节点)。

一般情况下,三层就足够了。
Innodb的数据页是16K
1000100010=1千万
在这里插入图片描述

Hash索引

比树要快
生成键值直接去找。
映射的地址值是不连续的,不能做范围查询。
Innodb不支持hash索引。
在这里插入图片描述

存储引擎

存储引擎有什么用?

  1. 存储引擎怎么来的?
  2. 这个东西能改吗?
  3. 不同的存储引擎,有什么区别?

默认的存储引擎: InnoDB, mysql 5.5版本以上。

需求:

  1. 我有一张表,希望有很快的访问速度, 不关心持久化问题(放在 内存当中)
  2. 存历史数据,能够去支持压缩
  3. 支持读写并发的操作, 提供较高的一致性

不同的需求,所以有不同的存储引擎。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
其他索引不应该存完整数据
聚集索引:存放的是完整数据,索引键值的逻辑顺序跟表数据行的物理存储顺序逻辑是一致的。

二级索引:存主键索引
在这里插入图片描述

5.索引的使用以及创建

  1. 不要给每个字段建立索引,因为会浪费空间
  2. 列的离散度 当你的离散度过低没有办法对比

字段值 : 男女/500W = 越接近0, 说明离散度越低
500W/500W = 越接近1, 说明离散度越高

  1. 联合索引的最左匹配

联合索引:
当第一索引一样的时候,才查第二个索引在这里插入图片描述

  1. 覆盖索引
    使用索引的概念,直接查的是索引的值。不需要查聚集索引,在辅助索引上就可一查的出来

索引的使用原则

1.你的索引不应该在select里面创建where join
2.索引个数不要太多
3.散列度低的数据不要建立索引
4.随机的或者无序的数据 不适合作为主键
5.创建复合索引避免冗余

失效的场景

1.索引上使用函数表达式
2.出现类型的隐式转换
3.like条件字符前模糊
4.负向查询 xxx!=NOT IN

这篇关于【直播笔记0505】涛哥的Mysql索引原理深入剖析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/831281

相关文章

Oracle查询表结构建表语句索引等方式

《Oracle查询表结构建表语句索引等方式》使用USER_TAB_COLUMNS查询表结构可避免系统隐藏字段(如LISTUSER的CLOB与VARCHAR2同名字段),这些字段可能为dbms_lob.... 目录oracle查询表结构建表语句索引1.用“USER_TAB_COLUMNS”查询表结构2.用“a

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

MySQL常用字符串函数示例和场景介绍

《MySQL常用字符串函数示例和场景介绍》MySQL提供了丰富的字符串函数帮助我们高效地对字符串进行处理、转换和分析,本文我将全面且深入地介绍MySQL常用的字符串函数,并结合具体示例和场景,帮你熟练... 目录一、字符串函数概述1.1 字符串函数的作用1.2 字符串函数分类二、字符串长度与统计函数2.1

SQL Server跟踪自动统计信息更新实战指南

《SQLServer跟踪自动统计信息更新实战指南》本文详解SQLServer自动统计信息更新的跟踪方法,推荐使用扩展事件实时捕获更新操作及详细信息,同时结合系统视图快速检查统计信息状态,重点强调修... 目录SQL Server 如何跟踪自动统计信息更新:深入解析与实战指南 核心跟踪方法1️⃣ 利用系统目录

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

Mysql中设计数据表的过程解析

《Mysql中设计数据表的过程解析》数据库约束通过NOTNULL、UNIQUE、DEFAULT、主键和外键等规则保障数据完整性,自动校验数据,减少人工错误,提升数据一致性和业务逻辑严谨性,本文介绍My... 目录1.引言2.NOT NULL——制定某列不可以存储NULL值2.UNIQUE——保证某一列的每一

解密SQL查询语句执行的过程

《解密SQL查询语句执行的过程》文章讲解了SQL语句的执行流程,涵盖解析、优化、执行三个核心阶段,并介绍执行计划查看方法EXPLAIN,同时提出性能优化技巧如合理使用索引、避免SELECT*、JOIN... 目录1. SQL语句的基本结构2. SQL语句的执行过程3. SQL语句的执行计划4. 常见的性能优

Spring Security 单点登录与自动登录机制的实现原理

《SpringSecurity单点登录与自动登录机制的实现原理》本文探讨SpringSecurity实现单点登录(SSO)与自动登录机制,涵盖JWT跨系统认证、RememberMe持久化Token... 目录一、核心概念解析1.1 单点登录(SSO)1.2 自动登录(Remember Me)二、代码分析三、

SQL Server 中的 WITH (NOLOCK) 示例详解

《SQLServer中的WITH(NOLOCK)示例详解》SQLServer中的WITH(NOLOCK)是一种表提示,等同于READUNCOMMITTED隔离级别,允许查询在不获取共享锁的情... 目录SQL Server 中的 WITH (NOLOCK) 详解一、WITH (NOLOCK) 的本质二、工作

MySQL 强制使用特定索引的操作

《MySQL强制使用特定索引的操作》MySQL可通过FORCEINDEX、USEINDEX等语法强制查询使用特定索引,但优化器可能不采纳,需结合EXPLAIN分析执行计划,避免性能下降,注意版本差异... 目录1. 使用FORCE INDEX语法2. 使用USE INDEX语法3. 使用IGNORE IND