【MySQL进阶之路 | 高级篇】InnoDB存储结构(页的内部结构)

2024-06-22 17:20

本文主要是介绍【MySQL进阶之路 | 高级篇】InnoDB存储结构(页的内部结构),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1. 数据库的存储结构 : 页

索引结构给我们提供了高效的索引方式,不过索引信息以及数据记录都是保存在文件上的.确切说是存储在页结构中.另一方面,索引是在存储引擎中实现的,MySQL服务器上的存储引擎负责对表中数据的读取和写入操作.不同的存储引擎中存放的格式一般不同.甚至有个存储引擎比如Memory都不用磁盘来存储数据,而是存储在内存中.重启MySQL服务器直接GG.

(1). 磁盘与内存交互基本单位:页

InnoDB将数据划分为若干个页,InnoDB中页的大小默认为16kb.以页作为磁盘和内存之间的交互的基本单位,也就是一次最少从磁盘中读取16kb的内容到内存中,一次最少把内存中的16kb的内容刷新到磁盘中.也就是说,在数据库中,不论读取一行,还是读取多行,都将这些行所在的页都加载到内存中.即,数据库管理存储空间的基本单位是页.数据库I/O操作的最小单位是页.一般情况下一个页可以存储多个行记录.

记录是按照行来存储的,但数据库的读取并不以行为单位,否则一次I/O操作只处理一行数据,效率会非常低.

(2). 页结构的概述

页a,页b,...这些页可以不在物理结构上相连,只需要通过双向链表在逻辑上相邻即可.每个数据页中的记录按照主键值从小到大的顺序组成一个单向链表,每个数据页都会为存储在其中的记录生成一个页目录,在通过主键查找某条记录的时候可以在页目录中通过二分法快速定位到对应的槽,然后再遍历槽对应分组中的记录即可快速找到指定的记录.

(3). 页的大小

不同数据库管理系统的页的大小是不同的.比如在MySQL的InnoDB存储引擎中,默认页的大小为16kb.

(4). 页的上层结构

另外在数据库中,还存在着区,段,和表空间的概念.行,页,区,段,表空间的关系如图.

1c1af07f4adc4c198f6d9b434ca85be4.png

  • 区是比页大一级的存储结构,在InnoDB存储结构中,一个区会分配64个连续的页.因为在InnoDB中页的大小默认是16kb的.所以一个区的大小是16*64kb=1mb.
  • 段是由一个或多个区组成.区在文件系统是一个连续分配的空间(在InnoDB中是连续的64个页),不过在段中不要求区与区之间是相邻的.段是数据库中的分配单位,不同类型的数据库对象以不同的段形式存在.当我们创建数据库表,索引的时候,就会创建相对应的段,比如创建一张表的时候创建表段,创建索引的时候创建一个索引段.
  • 表空间是一个逻辑容器.表空间存储的对象是段,在一个表空间中可以有一个或多个段,但是一个段只能属于一个表空间.数据库由一个或多个表空间组成,表空间从管理上可以划分为系统表空间和用户表空间,撤销表空间,临时表空间.

(5). 页的内部结构  超级重点

页如果按照类型划分,常见的有数据页(保存b+树节点),系统页,Undo页和事务数据页.数据页是我们最常用的页.

数据页的16kb大小的存储空间被划分为7个部分,分别是文件头,页头,最大最小记录,用户记录,空闲空间,页目录和文件尾.

4308af57afb0440d9ce7a1995630124f.png

这7个部分的作用.

d35afda1cae343ca829d7152f1a650f0.png

1). 文件头(File Header)和文件尾(File Trailer)

首先是文件通用部分,也就是文件头和文件尾.

文件头部信息.

  • 不同类型的页都会以File Header作为第一个组成部分,它描述了一些针对各种页都通用的一些信息.比方说这个页的编号是多少,它上一个页是谁,下一个页是谁等等.所有的数据页会组成一个双向链表.

文件头的构成.

ac41359b033a4b23a209ce1c04e46db7.png

2). 记录部分(Free Space User Records InfiMum SuperMum)

页的主要作用是存储记录,所以最大最小记录和用户记录占了页结构的主要空间.

7685a626a21c470bb79b1054ef6bcbaf.png

1.空闲空间(Free Space)和用户记录(User Records)

我们自己存储的记录会按照指定的行格式存储到User Records部分.但是在一开始生成页的时候,其实并没有User Records这一部分,也就是尚未使用的存储空间中申请一个记录大小的空间划分到User Records.当Free Space部分的空间全部被User Records部分替代后,也就意味着这个页用完了,如果还有其他记录插入,就需要去申请其他新的页.

User Records中这些记录按照指定的行格式一条一条摆在User Records部分,相互之间形成了单链表.

2. 最小最大记录(Infimum, Supermum)

记录是可以比大小的,对于一个完整的记录,比较记录的大小就是比较主键值的大小.InnoDB规定的最小最大记录这两个记录的构造非常简单,都是由5个字节大小的记录头信息和8个字节的一个固定部分组成.

e183f6de75fe4fa6b01e7b22f8477741.png

3). 页目录(Page Directory)

在页中,记录是以单向链表的形式进行存储的.单向链表的特点是插入删除非常方便,但查找效率不高.因此在页结构专门设计了一个页目录这个模块.专门给记录做一个记录,通过二分查找的方式进行检索.

将所有的记录分组,这些记录包括最小记录和最大记录.但不包括已经被"删除"的记录(实际物理磁盘上依然存在,逻辑上是删除的).

第一组 : 就是最小记录所在的分组,只有一条记录.

最后一组 : 就是最大记录所在的分组.会有1-8条记录.

其余的组记录数量在4-8之间.

这样做的好处是除了第一组外,其他组的记录数会尽量平分.

在每个组中最后一条记录的记录头信息中会存储该组有多少条记录.作为n_owned字段的值.

页目录就是用来存储每组最后一条记录的地址偏移量.这些偏移量会按照先后顺序存储起来,每组的地址偏移量也被称为槽slot.每个槽相当于指针指向了不同组的最后一个记录.

719f63f928fc41fc93676ea8273880ee.png

4). 页面头部(Page Header)

为了得到一个数据页中存储的记录的状态信息,比如本页存储了多少条记录,第一条记录的地址是什么等,特意在页中定义了一个叫page header的部分.这个部分占固定的56个字节.

这篇关于【MySQL进阶之路 | 高级篇】InnoDB存储结构(页的内部结构)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1084924

相关文章

Oracle查询表结构建表语句索引等方式

《Oracle查询表结构建表语句索引等方式》使用USER_TAB_COLUMNS查询表结构可避免系统隐藏字段(如LISTUSER的CLOB与VARCHAR2同名字段),这些字段可能为dbms_lob.... 目录oracle查询表结构建表语句索引1.用“USER_TAB_COLUMNS”查询表结构2.用“a

python panda库从基础到高级操作分析

《pythonpanda库从基础到高级操作分析》本文介绍了Pandas库的核心功能,包括处理结构化数据的Series和DataFrame数据结构,数据读取、清洗、分组聚合、合并、时间序列分析及大数据... 目录1. Pandas 概述2. 基本操作:数据读取与查看3. 索引操作:精准定位数据4. Group

MySQL中EXISTS与IN用法使用与对比分析

《MySQL中EXISTS与IN用法使用与对比分析》在MySQL中,EXISTS和IN都用于子查询中根据另一个查询的结果来过滤主查询的记录,本文将基于工作原理、效率和应用场景进行全面对比... 目录一、基本用法详解1. IN 运算符2. EXISTS 运算符二、EXISTS 与 IN 的选择策略三、性能对比

MySQL常用字符串函数示例和场景介绍

《MySQL常用字符串函数示例和场景介绍》MySQL提供了丰富的字符串函数帮助我们高效地对字符串进行处理、转换和分析,本文我将全面且深入地介绍MySQL常用的字符串函数,并结合具体示例和场景,帮你熟练... 目录一、字符串函数概述1.1 字符串函数的作用1.2 字符串函数分类二、字符串长度与统计函数2.1

SQL Server跟踪自动统计信息更新实战指南

《SQLServer跟踪自动统计信息更新实战指南》本文详解SQLServer自动统计信息更新的跟踪方法,推荐使用扩展事件实时捕获更新操作及详细信息,同时结合系统视图快速检查统计信息状态,重点强调修... 目录SQL Server 如何跟踪自动统计信息更新:深入解析与实战指南 核心跟踪方法1️⃣ 利用系统目录

MySQL 内存使用率常用分析语句

《MySQL内存使用率常用分析语句》用户整理了MySQL内存占用过高的分析方法,涵盖操作系统层确认及数据库层bufferpool、内存模块差值、线程状态、performance_schema性能数据... 目录一、 OS层二、 DB层1. 全局情况2. 内存占js用详情最近连续遇到mysql内存占用过高导致

Mysql中设计数据表的过程解析

《Mysql中设计数据表的过程解析》数据库约束通过NOTNULL、UNIQUE、DEFAULT、主键和外键等规则保障数据完整性,自动校验数据,减少人工错误,提升数据一致性和业务逻辑严谨性,本文介绍My... 目录1.引言2.NOT NULL——制定某列不可以存储NULL值2.UNIQUE——保证某一列的每一

解密SQL查询语句执行的过程

《解密SQL查询语句执行的过程》文章讲解了SQL语句的执行流程,涵盖解析、优化、执行三个核心阶段,并介绍执行计划查看方法EXPLAIN,同时提出性能优化技巧如合理使用索引、避免SELECT*、JOIN... 目录1. SQL语句的基本结构2. SQL语句的执行过程3. SQL语句的执行计划4. 常见的性能优

SQL Server 中的 WITH (NOLOCK) 示例详解

《SQLServer中的WITH(NOLOCK)示例详解》SQLServer中的WITH(NOLOCK)是一种表提示,等同于READUNCOMMITTED隔离级别,允许查询在不获取共享锁的情... 目录SQL Server 中的 WITH (NOLOCK) 详解一、WITH (NOLOCK) 的本质二、工作

MySQL 强制使用特定索引的操作

《MySQL强制使用特定索引的操作》MySQL可通过FORCEINDEX、USEINDEX等语法强制查询使用特定索引,但优化器可能不采纳,需结合EXPLAIN分析执行计划,避免性能下降,注意版本差异... 目录1. 使用FORCE INDEX语法2. 使用USE INDEX语法3. 使用IGNORE IND