MySQL 为什么采用 B+树作为索引?不只告诉你答案还告诉你答案背后的脉络,五年经验程序员整理回答

本文主要是介绍MySQL 为什么采用 B+树作为索引?不只告诉你答案还告诉你答案背后的脉络,五年经验程序员整理回答,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

坐对真成被花恼,出门一笑大江横 前言 为什么 MySQL 采用B+树作为索引? 如果纯粹的猜测MySQL数据库索引为什么使用B+树?那么围绕这个问题的回答通常一定是围绕B+树本身是什么,有什么优势这两点去解释这个问题。 (这不是我开始这么去想的,看了很多文章都是从这一维度问答,这些回答让我失望啊。直到那天问了坐在我旁边那个整天摸鱼的5年程序员;他慵懒的回答:你想为什么是使用的是树结构呢? 咦,听到这回答,一下打开了我的思绪,有点意思!) 先抛开B+树是什么,有什么优势,这些先入为主的答案。 (我并不想要这个往我脑袋硬塞的硬邦邦的答案。) 我想要的是为什么? 为什么MySQL的索引有那么多的数据结构可选,偏偏选树结构?为什么那么多的树结构?为什么又偏偏采用 B+ 树作为索引? 这才是我要想明白的!我想要的是不只是答案还要答案背后的脉络! 我想要的不仅是要知其然,更想要知其所以然。 那么多数据结构,为什么选树结构? 众多的数据结构在逻辑层面可分为:线性结构 和 非线性结构。 线性结构有:数组、链表,基于它们衍生出的有哈希表(哈希表也称散列表)、栈、队列等。 非线性结构有:树、图。 还有其他数据结构如:跳表、位图 也都由基础数据结构演化而来,不同的数据结构存在即都是为了解决某些场景问题。 如果要知道索引适合什么数据结构,那我们得先来回答索引需要来解决什么样的问题(痛点)?和发挥着什么样的作用?其次再才是选择什么样的数据结构;后者只是果,前者才是因。 我们都知道MySQL存储的数据是在磁盘里,因为即使设备断电,放在磁盘的数据是不会有影响的,保障了数据不丢失,这意味着MySQL在磁盘上的数据是持久化的。 但数据存储在磁盘得到保障的同时也是有代价的,这代价就是磁盘的处理速度是毫秒级别的,相比内存纳秒级别的速度,简直是小巫见大巫。 你可能对时间单位没什么概念,可以看 1毫秒能慢上纳秒几万倍。

编辑

添加图片注释,不超过 140 字(可选)

索引虽然存储在磁盘上,但使用索引查找数据时,可以从磁盘先读取索引放到内存中,再通过索引从磁盘找到数据;再然后将磁盘读取到的数据也放到内存里。 索引就让磁盘和内存强强联手,趁机搭上了内存的车,感受了一把纳秒级别速度的推背感。

编辑

添加图片注释,不超过 140 字(可选)

但是不管查询的过程中怎么优化,只要根还在磁盘,就避免不了会发生多次磁盘 I/O ,而磁盘 I/O 次数越多,消耗的时间也越多。 (聪明的同学这会可以看出这其实就是个需要考虑解决的痛点了)

  • 要尽少在磁盘做 I/O 操作。

但还有那么多的数据结构可选呢。 其实索引的需要发挥的目的已经决定了有哪些数据结构可选,那么就可以缩小选择其他数据结构的范围。 从为什么要建索引本身的首要目的出发。

  • 要能尽快的按照区间高效地范围查找。

当然索引首要目的能支持高效范围查询,还要有插入更新等操作的动态数据结构。 所以有满足以这两条主要条件的除了树结构你还会想到其他什么数据结构? 哈希表、跳表 哈希表 先看哈希表,哈希表对于我们来说太熟悉不过,哈希表的物理存储是一个数组,而数组在内存中是连续地址的空间。数据以Key、Value的方式存储。哈希表拥有精确的查询,所以时间复杂度是 O(1)。 而哈希表之所以能这么快是通过Key计算数组下标来快速找到Value。最简单的计算的方式是 余数法,通过先计算key的 HashCode,再通过哈希表的数组长度对 HashCode 求余,求余得出的余数就是数组下标,最后由下标访问到哈希表中存的Key、Value。

编辑切换为居中

添加图片注释,不超过 140 字(可选)

但是 Key 计算出的下标

这篇关于MySQL 为什么采用 B+树作为索引?不只告诉你答案还告诉你答案背后的脉络,五年经验程序员整理回答的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/406736

相关文章

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

深入理解Mysql OnlineDDL的算法

《深入理解MysqlOnlineDDL的算法》本文主要介绍了讲解MysqlOnlineDDL的算法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小... 目录一、Online DDL 是什么?二、Online DDL 的三种主要算法2.1COPY(复制法)

mysql8.0.43使用InnoDB Cluster配置主从复制

《mysql8.0.43使用InnoDBCluster配置主从复制》本文主要介绍了mysql8.0.43使用InnoDBCluster配置主从复制,文中通过示例代码介绍的非常详细,对大家的学习或者... 目录1、配置Hosts解析(所有服务器都要执行)2、安装mysql shell(所有服务器都要执行)3、

k8s中实现mysql主备过程详解

《k8s中实现mysql主备过程详解》文章讲解了在K8s中使用StatefulSet部署MySQL主备架构,包含NFS安装、storageClass配置、MySQL部署及同步检查步骤,确保主备数据一致... 目录一、k8s中实现mysql主备1.1 环境信息1.2 部署nfs-provisioner1.2.

MySQL中VARCHAR和TEXT的区别小结

《MySQL中VARCHAR和TEXT的区别小结》MySQL中VARCHAR和TEXT用于存储字符串,VARCHAR可变长度存储在行内,适合短文本;TEXT存储在溢出页,适合大文本,下面就来具体的了解... 目录一、VARCHAR 和 TEXT 基本介绍1. VARCHAR2. TEXT二、VARCHAR

MySQL中C接口的实现

《MySQL中C接口的实现》本节内容介绍使用C/C++访问数据库,包括对数据库的增删查改操作,主要是学习一些接口的调用,具有一定的参考价值,感兴趣的可以了解一下... 目录准备mysql库使用mysql库编译文件官方API文档对象的创建和关闭链接数据库下达sql指令select语句前言:本节内容介绍使用C/

mybatis直接执行完整sql及踩坑解决

《mybatis直接执行完整sql及踩坑解决》MyBatis可通过select标签执行动态SQL,DQL用ListLinkedHashMap接收结果,DML用int处理,注意防御SQL注入,优先使用#... 目录myBATiFBNZQs直接执行完整sql及踩坑select语句采用count、insert、u

MySQL之搜索引擎使用解读

《MySQL之搜索引擎使用解读》MySQL存储引擎是数据存储和管理的核心组件,不同引擎(如InnoDB、MyISAM)采用不同机制,InnoDB支持事务与行锁,适合高并发场景;MyISAM不支持事务,... 目录mysql的存储引擎是什么MySQL存储引擎的功能MySQL的存储引擎的分类查看存储引擎1.命令

一文详解MySQL索引(六张图彻底搞懂)

《一文详解MySQL索引(六张图彻底搞懂)》MySQL索引的建立对于MySQL的高效运行是很重要的,索引可以大大提高MySQL的检索速度,:本文主要介绍MySQL索引的相关资料,文中通过代码介绍的... 目录一、什么是索引?为什么需要索引?二、索引该用哪种数据结构?1. 哈希表2. 跳表3. 二叉排序树4.

MySQL批量替换数据库字符集的实用方法(附详细代码)

《MySQL批量替换数据库字符集的实用方法(附详细代码)》当需要修改数据库编码和字符集时,通常需要对其下属的所有表及表中所有字段进行修改,下面:本文主要介绍MySQL批量替换数据库字符集的实用方法... 目录前言为什么要批量修改字符集?整体脚本脚本逻辑解析1. 设置目标参数2. 生成修改表默认字符集的语句3