【MySQL进阶之路 | 高级篇】InnoDB存储结构(页的内部结构)

2024-06-22 17:20

本文主要是介绍【MySQL进阶之路 | 高级篇】InnoDB存储结构(页的内部结构),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 数据库的存储结构 : 页

索引结构给我们提供了高效的索引方式,不过索引信息以及数据记录都是保存在文件上的.确切说是存储在页结构中.另一方面,索引是在存储引擎中实现的,MySQL服务器上的存储引擎负责对表中数据的读取和写入操作.不同的存储引擎中存放的格式一般不同.甚至有个存储引擎比如Memory都不用磁盘来存储数据,而是存储在内存中.重启MySQL服务器直接GG.

(1). 磁盘与内存交互基本单位:页

InnoDB将数据划分为若干个页,InnoDB中页的大小默认为16kb.以页作为磁盘和内存之间的交互的基本单位,也就是一次最少从磁盘中读取16kb的内容到内存中,一次最少把内存中的16kb的内容刷新到磁盘中.也就是说,在数据库中,不论读取一行,还是读取多行,都将这些行所在的页都加载到内存中.即,数据库管理存储空间的基本单位是页.数据库I/O操作的最小单位是页.一般情况下一个页可以存储多个行记录.

记录是按照行来存储的,但数据库的读取并不以行为单位,否则一次I/O操作只处理一行数据,效率会非常低.

(2). 页结构的概述

页a,页b,...这些页可以不在物理结构上相连,只需要通过双向链表在逻辑上相邻即可.每个数据页中的记录按照主键值从小到大的顺序组成一个单向链表,每个数据页都会为存储在其中的记录生成一个页目录,在通过主键查找某条记录的时候可以在页目录中通过二分法快速定位到对应的槽,然后再遍历槽对应分组中的记录即可快速找到指定的记录.

(3). 页的大小

不同数据库管理系统的页的大小是不同的.比如在MySQL的InnoDB存储引擎中,默认页的大小为16kb.

(4). 页的上层结构

另外在数据库中,还存在着区,段,和表空间的概念.行,页,区,段,表空间的关系如图.

1c1af07f4adc4c198f6d9b434ca85be4.png

  • 区是比页大一级的存储结构,在InnoDB存储结构中,一个区会分配64个连续的页.因为在InnoDB中页的大小默认是16kb的.所以一个区的大小是16*64kb=1mb.
  • 段是由一个或多个区组成.区在文件系统是一个连续分配的空间(在InnoDB中是连续的64个页),不过在段中不要求区与区之间是相邻的.段是数据库中的分配单位,不同类型的数据库对象以不同的段形式存在.当我们创建数据库表,索引的时候,就会创建相对应的段,比如创建一张表的时候创建表段,创建索引的时候创建一个索引段.
  • 表空间是一个逻辑容器.表空间存储的对象是段,在一个表空间中可以有一个或多个段,但是一个段只能属于一个表空间.数据库由一个或多个表空间组成,表空间从管理上可以划分为系统表空间和用户表空间,撤销表空间,临时表空间.

(5). 页的内部结构  超级重点

页如果按照类型划分,常见的有数据页(保存b+树节点),系统页,Undo页和事务数据页.数据页是我们最常用的页.

数据页的16kb大小的存储空间被划分为7个部分,分别是文件头,页头,最大最小记录,用户记录,空闲空间,页目录和文件尾.

4308af57afb0440d9ce7a1995630124f.png

这7个部分的作用.

d35afda1cae343ca829d7152f1a650f0.png

1). 文件头(File Header)和文件尾(File Trailer)

首先是文件通用部分,也就是文件头和文件尾.

文件头部信息.

  • 不同类型的页都会以File Header作为第一个组成部分,它描述了一些针对各种页都通用的一些信息.比方说这个页的编号是多少,它上一个页是谁,下一个页是谁等等.所有的数据页会组成一个双向链表.

文件头的构成.

ac41359b033a4b23a209ce1c04e46db7.png

2). 记录部分(Free Space User Records InfiMum SuperMum)

页的主要作用是存储记录,所以最大最小记录和用户记录占了页结构的主要空间.

7685a626a21c470bb79b1054ef6bcbaf.png

1.空闲空间(Free Space)和用户记录(User Records)

我们自己存储的记录会按照指定的行格式存储到User Records部分.但是在一开始生成页的时候,其实并没有User Records这一部分,也就是尚未使用的存储空间中申请一个记录大小的空间划分到User Records.当Free Space部分的空间全部被User Records部分替代后,也就意味着这个页用完了,如果还有其他记录插入,就需要去申请其他新的页.

User Records中这些记录按照指定的行格式一条一条摆在User Records部分,相互之间形成了单链表.

2. 最小最大记录(Infimum, Supermum)

记录是可以比大小的,对于一个完整的记录,比较记录的大小就是比较主键值的大小.InnoDB规定的最小最大记录这两个记录的构造非常简单,都是由5个字节大小的记录头信息和8个字节的一个固定部分组成.

e183f6de75fe4fa6b01e7b22f8477741.png

3). 页目录(Page Directory)

在页中,记录是以单向链表的形式进行存储的.单向链表的特点是插入删除非常方便,但查找效率不高.因此在页结构专门设计了一个页目录这个模块.专门给记录做一个记录,通过二分查找的方式进行检索.

将所有的记录分组,这些记录包括最小记录和最大记录.但不包括已经被"删除"的记录(实际物理磁盘上依然存在,逻辑上是删除的).

第一组 : 就是最小记录所在的分组,只有一条记录.

最后一组 : 就是最大记录所在的分组.会有1-8条记录.

其余的组记录数量在4-8之间.

这样做的好处是除了第一组外,其他组的记录数会尽量平分.

在每个组中最后一条记录的记录头信息中会存储该组有多少条记录.作为n_owned字段的值.

页目录就是用来存储每组最后一条记录的地址偏移量.这些偏移量会按照先后顺序存储起来,每组的地址偏移量也被称为槽slot.每个槽相当于指针指向了不同组的最后一个记录.

719f63f928fc41fc93676ea8273880ee.png

4). 页面头部(Page Header)

为了得到一个数据页中存储的记录的状态信息,比如本页存储了多少条记录,第一条记录的地址是什么等,特意在页中定义了一个叫page header的部分.这个部分占固定的56个字节.

这篇关于【MySQL进阶之路 | 高级篇】InnoDB存储结构(页的内部结构)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1084924

相关文章

MySQL的JDBC编程详解

《MySQL的JDBC编程详解》:本文主要介绍MySQL的JDBC编程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言一、前置知识1. 引入依赖2. 认识 url二、JDBC 操作流程1. JDBC 的写操作2. JDBC 的读操作总结前言本文介绍了mysq

java.sql.SQLTransientConnectionException连接超时异常原因及解决方案

《java.sql.SQLTransientConnectionException连接超时异常原因及解决方案》:本文主要介绍java.sql.SQLTransientConnectionExcep... 目录一、引言二、异常信息分析三、可能的原因3.1 连接池配置不合理3.2 数据库负载过高3.3 连接泄漏

Linux下MySQL数据库定时备份脚本与Crontab配置教学

《Linux下MySQL数据库定时备份脚本与Crontab配置教学》在生产环境中,数据库是核心资产之一,定期备份数据库可以有效防止意外数据丢失,本文将分享一份MySQL定时备份脚本,并讲解如何通过cr... 目录备份脚本详解脚本功能说明授权与可执行权限使用 Crontab 定时执行编辑 Crontab添加定

JavaScript中的高级调试方法全攻略指南

《JavaScript中的高级调试方法全攻略指南》什么是高级JavaScript调试技巧,它比console.log有何优势,如何使用断点调试定位问题,通过本文,我们将深入解答这些问题,带您从理论到实... 目录观点与案例结合观点1观点2观点3观点4观点5高级调试技巧详解实战案例断点调试:定位变量错误性能分

Vite 打包目录结构自定义配置小结

《Vite打包目录结构自定义配置小结》在Vite工程开发中,默认打包后的dist目录资源常集中在asset目录下,不利于资源管理,本文基于Rollup配置原理,本文就来介绍一下通过Vite配置自定义... 目录一、实现原理二、具体配置步骤1. 基础配置文件2. 配置说明(1)js 资源分离(2)非 JS 资

MyBatis-plus处理存储json数据过程

《MyBatis-plus处理存储json数据过程》文章介绍MyBatis-Plus3.4.21处理对象与集合的差异:对象可用内置Handler配合autoResultMap,集合需自定义处理器继承F... 目录1、如果是对象2、如果需要转换的是List集合总结对象和集合分两种情况处理,目前我用的MP的版本

MySQL中On duplicate key update的实现示例

《MySQL中Onduplicatekeyupdate的实现示例》ONDUPLICATEKEYUPDATE是一种MySQL的语法,它在插入新数据时,如果遇到唯一键冲突,则会执行更新操作,而不是抛... 目录1/ ON DUPLICATE KEY UPDATE的简介2/ ON DUPLICATE KEY UP

MySQL分库分表的实践示例

《MySQL分库分表的实践示例》MySQL分库分表适用于数据量大或并发压力高的场景,核心技术包括水平/垂直分片和分库,需应对分布式事务、跨库查询等挑战,通过中间件和解决方案实现,最佳实践为合理策略、备... 目录一、分库分表的触发条件1.1 数据量阈值1.2 并发压力二、分库分表的核心技术模块2.1 水平分

从基础到高级详解Python数值格式化输出的完全指南

《从基础到高级详解Python数值格式化输出的完全指南》在数据分析、金融计算和科学报告领域,数值格式化是提升可读性和专业性的关键技术,本文将深入解析Python中数值格式化输出的相关方法,感兴趣的小伙... 目录引言:数值格式化的核心价值一、基础格式化方法1.1 三种核心格式化方式对比1.2 基础格式化示例

Python与MySQL实现数据库实时同步的详细步骤

《Python与MySQL实现数据库实时同步的详细步骤》在日常开发中,数据同步是一项常见的需求,本篇文章将使用Python和MySQL来实现数据库实时同步,我们将围绕数据变更捕获、数据处理和数据写入这... 目录前言摘要概述:数据同步方案1. 基本思路2. mysql Binlog 简介实现步骤与代码示例1