J. Cole 的 InnoDB 系列 - 3. InnoDB空间文件布局的基础

2023-10-14 04:10

本文主要是介绍J. Cole 的 InnoDB 系列 - 3. InnoDB空间文件布局的基础,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

原文地址:blog.jcole.us/2013/01/03/…

在数据存储模型中,通常有“空间”这个概念,在 MySQL 中被称为“表空间”,有时候在 InnoDB 中也被称为“文件空间”。一个空间可能由一个操作系统中的多个实际文件组成(例如 ibdata1, ibdata2 等等),实际上只是一个逻辑文件 - 多个文理文件被当做一个连接在一起的文件处理。

InnoDB 中每个空间都被分配了一个 32 位的无符号整型空间 ID,这个 ID 被用来在不同的地方引用指向这个空间。InnoDB 总是有一个“系统空间”,他的空间 ID 是 0。系统空间用于保存 InnoDB 的一系列元数据的记录。通过 MySQL,InnoDB 目前只支持“一个表一个文件”空间形式的额外空间,这将为每一个 MySQL 表创建 .ibd 文件。从内部来看,这个 .ibd 文件实际是一个可以容纳多个表的完整的空间,但是在 MySQL 的实现中,它只能包含一个表。

每个空间被切分成了,一般每 16 KiB(也可以通过在编译时指定 UNIV_PAGE_SIZE 修改,或者开启了 InnoDB 压缩)。空间中的会被分配一个 32 位的页码,这个页码被称为偏移,其实这个页码就是从空间地址开头的页偏移。所以,第 0 页位于文件偏移 0 的位置,第 1 页位于文件偏移 16384 的位置,以此类推。可能这里有些人会想起来,InnoDB 的数据大小限制是 64 TiB,这个其实是每个空间的大小限制。因为页码是一个 32 位的无符号整型,并且默认的页大小是 16 KiB,这样空间最大大小是 2^32 * 16 KiB = 64 TiB

的结构如下:

image

每一页都有一个 38 字节的 FIL 头部和一个 FIL 尾部(FIL这个名字其实就是出自 “file”的简写)。头部包含一个表示页类型的字段,这个类型决定了页的剩下部分的结构。 FIL 头部和 FIL 尾部结构如下所示:

image

FIL 头部以及尾部包含以下结构:

  • 页类型(2 bytes):这对于解析剩下的页数据是很重要的。很多模块以及场景下需要分配页存储,包括文件空间管理范围管理事务系统数据字段undo logblobs 数据 还有索引以及表数据
  • 空间 ID(4 bytes)
  • 页码(4 bytes):当被初始化的时候页码就被存入了。检查该字段保存的页码与根据文件偏移量读取到的页码是否匹配,有助于表明读取是否是正确的。并且,如果这个字段被初始化了,表明这个也被初始化了
  • checksum(4 bytes)和老版 checksum(4 bytes)
  • 上一页(4 bytes)与下一页(4 bytes)的指针:这样可以构建双向链表,并用于索引页来讲所有页在同一级别链接起来,从而提高索引全扫描的效率。但是有很多页面类型不使用这些字段。
  • 头部保存最近修改对应的 LSN(日志序列号,8 bytes),同时这个序列号的低 32 位也保存在尾部
  • 全局最大的日志序列号(被称为 flush LSN,8 bytes),真正的序列号只保存在第 0 个空间的第 0 页,其他页这个字段的值都是 0,相当于都复用第 0 个空间的第 0 页的这个字段。这样全局发生修改的时候只用修改一个字段就行了。

空间文件

一个空间文件是很多(最多 2^32)的聚合链接,为了更高效的管理,被聚合成很多个 1 MiB 大小的块(64 个连续页,默认页大小是 16 KiB),这个块被称为“区”(extent)。很多结构只通过引用来在一个空间中分配

InnoDB 需要做一些元数据记录,来追踪所有以及空间本身。

image

空间中的第一页是 FSP_HDR(文件空间头页)。FSP_HDR 页包含一个 FSP 结构,记录像是空间的大小空闲区碎片区满区的列表等数据(将来我会写一篇详细的关于空闲空间管理介绍的文章)。 一页 FSP_HDR 只有够保存 256 个(相当于 16384 ,256 MiB)信息的空间,所以每 16384 页之后,都需要额外记录这些页信息的空间。XDES 页和 FSP_HDR 页的结构是相同的,只是在 XDESFSP 占用的存储都是被 0 填充的。这些额外的会随着空间文件的增长而自动分配。

INODE 页用来保存文件(Segmentation,包含一组以及一个只会单独分配的碎片区的数组)的列表。每个 INDOE 页可以保存 85 个 INODE 元素,每个索引需要两个 INODE 元素(将来我会写一篇详细的关于 INDOE 元素内容和文件的文章)。

IBUF_BITMAP 页保存关于插入缓存的信息,不在本系列的讨论范围内。

系统空间

系统空间(第 0 个空间)比较特殊,包含许多按固定页码分配的页面,以存储对 InnoDB 操作至关重要的大量信息。系统空间与任何其他空间一样,也需要 FSP_HDR, IBUF_BITMAPInode 这三个页面作为头三页。这之后,与其他页面有点区别。

image

  • 第 3 页,SYS 类型:与插入缓存相关的头信息。
  • 第 4 页,INDEX 类型:用于插入缓冲的索引结构的根页。
  • 第 5 页,TRX_SYS 类型:与 InnoDB 事务系统的操作相关的信息,例如最新的事务ID、MySQL二进制日志信息和双写缓冲区范围的位置。
  • 第 6 页,SYS 类型:第一个回滚段页。根据需要分配其他页(或整个区段)来存储回滚段数据。
  • 第 7 页,SYS 类型:与数据字典相关的头信息,包含组成数据字典的索引的根页码。这些信息能够找到任何其他索引(表),由于它们的根页码就存储在这个数据字典中。
  • 第 64 - 127 页:双写缓冲区中第一块(包含 64 页),双写缓冲区是 InnoDB 恢复机制的一个重要部分
  • 第 128 - 191 页:双写缓冲区中第二块

其他页按需分配给索引、回滚段、撤消日志(undo logs)等.

每个表空间文件

InnoDB提供了“每个表一个文件”模式,该模式将为每个 MySQL 表创建一个文件(如上所述实际上是一个空间)。可能叫做“每个表一个空间”更合适一些。每个表都会创建 .ibd 文件,它的结构如下:

image

忽略快速添加索引(即在运行时添加索引),在必需的3个初始页之后,空间中分配的下一个页面将是表中每个索引的根页,按表创建中定义的索引顺序排列。第 3 页将是聚集索引的根第 4 页将是第一个二级索引的根,以此类推。

由于 InnoDB 的大部分元数据结构都存储在系统空间中,因此在“每个表一个空间”中分配的大多数页都是 INDEX 类型的并存储表数据。

这篇关于J. Cole 的 InnoDB 系列 - 3. InnoDB空间文件布局的基础的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/208049

相关文章

从基础到进阶详解Pandas时间数据处理指南

《从基础到进阶详解Pandas时间数据处理指南》Pandas构建了完整的时间数据处理生态,核心由四个基础类构成,Timestamp,DatetimeIndex,Period和Timedelta,下面我... 目录1. 时间数据类型与基础操作1.1 核心时间对象体系1.2 时间数据生成技巧2. 时间索引与数据

安装centos8设置基础软件仓库时出错的解决方案

《安装centos8设置基础软件仓库时出错的解决方案》:本文主要介绍安装centos8设置基础软件仓库时出错的解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录安装Centos8设置基础软件仓库时出错版本 8版本 8.2.200android4版本 javas

Linux基础命令@grep、wc、管道符的使用详解

《Linux基础命令@grep、wc、管道符的使用详解》:本文主要介绍Linux基础命令@grep、wc、管道符的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录grep概念语法作用演示一演示二演示三,带选项 -nwc概念语法作用wc,不带选项-c,统计字节数-

MySQL启动报错:InnoDB表空间丢失问题及解决方法

《MySQL启动报错:InnoDB表空间丢失问题及解决方法》在启动MySQL时,遇到了InnoDB:Tablespace5975wasnotfound,该错误表明MySQL在启动过程中无法找到指定的s... 目录mysql 启动报错:InnoDB 表空间丢失问题及解决方法错误分析解决方案1. 启用 inno

python操作redis基础

《python操作redis基础》Redis(RemoteDictionaryServer)是一个开源的、基于内存的键值对(Key-Value)存储系统,它通常用作数据库、缓存和消息代理,这篇文章... 目录1. Redis 简介2. 前提条件3. 安装 python Redis 客户端库4. 连接到 Re

在Java中基于Geotools对PostGIS数据库的空间查询实践教程

《在Java中基于Geotools对PostGIS数据库的空间查询实践教程》本文将深入探讨这一实践,从连接配置到复杂空间查询操作,包括点查询、区域范围查询以及空间关系判断等,全方位展示如何在Java环... 目录前言一、相关技术背景介绍1、评价对象AOI2、数据处理流程二、对AOI空间范围查询实践1、空间查

MySQL表空间结构详解表空间到段页操作

《MySQL表空间结构详解表空间到段页操作》在MySQL架构和存储引擎专题中介绍了使用不同存储引擎创建表时生成的表空间数据文件,在本章节主要介绍使用InnoDB存储引擎创建表时生成的表空间数据文件,对... 目录️‍一、什么是表空间结构1.1 表空间与表空间文件的关系是什么?️‍二、用户数据在表空间中是怎么

SpringBoot基础框架详解

《SpringBoot基础框架详解》SpringBoot开发目的是为了简化Spring应用的创建、运行、调试和部署等,使用SpringBoot可以不用或者只需要很少的Spring配置就可以让企业项目快... 目录SpringBoot基础 – 框架介绍1.SpringBoot介绍1.1 概述1.2 核心功能2

CentOS7增加Swap空间的两种方法

《CentOS7增加Swap空间的两种方法》当服务器物理内存不足时,增加Swap空间可以作为虚拟内存使用,帮助系统处理内存压力,本文给大家介绍了CentOS7增加Swap空间的两种方法:创建新的Swa... 目录在Centos 7上增加Swap空间的方法方法一:创建新的Swap文件(推荐)方法二:调整Sww

CSS3 布局样式及其应用举例

《CSS3布局样式及其应用举例》CSS3的布局特性为前端开发者提供了无限可能,无论是Flexbox的一维布局还是Grid的二维布局,它们都能够帮助开发者以更清晰、简洁的方式实现复杂的网页布局,本文给... 目录深入探讨 css3 布局样式及其应用引言一、CSS布局的历史与发展1.1 早期布局的局限性1.2