MySQL 的基础 一 (连接池, SQL接口, 查询解析器, 查询优化器, 存储引擎接口, 执行器)

本文主要是介绍MySQL 的基础 一 (连接池, SQL接口, 查询解析器, 查询优化器, 存储引擎接口, 执行器),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

1  MySQL数据库的连接池

2  网络连接必须让线程来处理

3  SQL接口:负责处理接收到的SQL语句

4  查询解析器:让MySQL能看懂SQL语句

5  查询优化器:选择最优的查询路径

6  调用存储引擎接口,真正执行SQL语句

7  执行器:根据执行计划调用存储引擎的接口


1  MySQL数据库的连接池

当多个系统访问同一个数据库时,每个系统会通过数据库连接池创建多个连接供多线程使用。同样,MySQL 也需要维护与这些系统的多个连接。因此,MySQL 架构的第一个环节是连接池,它负责维护这些连接。同时,每次系统连接 MySQL 时,MySQL 都会根据提供的账号和密码进行身份验证,并检查库表权限。

2  网络连接必须让线程来处理

当数据库服务器的连接池中的某个连接接收到网络请求(如一条 SQL 语句)时,谁负责监听并处理这个请求呢?

其实,网络连接的处理需要分配给一个线程。这个线程负责监听网络请求,并从连接中读取数据,随后解析并执行 SQL 语句。如果你熟悉计算机的基础知识,就会知道线程在这种情况下是关键,它负责从网络连接中读取请求并进行处理,如下图所示。

3  SQL接口:负责处理接收到的SQL语句

MySQL 内部首先提供了一个 SQL 接口(SQL Interface)组件,它专门用于执行我们发送给 MySQL 的增删改查 SQL 语句。当工作线程接收到 SQL 语句后,会将其交给 SQL 接口处理并执行。SQL 接口负责将这些请求转化为 MySQL 能理解的操作,如下图所示。

4  查询解析器:让MySQL能看懂SQL语句

当我们执行一个 SQL 语句,例如:

SELECT id, name, age

FROM users

WHERE id = 1;

人脑可以立刻理解它的含义:查询 users 表中 id 等于 1 的那行数据,并提取 id, name, age 三个字段。然而,MySQL 是一个数据库管理系统,不能直接理解这些 SQL 语句。

因此,查询解析器(Parser) 就显得非常重要。它负责解析 SQL 语句,将其分解为 MySQL 可以理解的操作步骤。以这个查询为例,查询解析器会将 SQL 拆解为以下几个部分:

  1. 要从 users 表中查询数据。
  2. 查询条件是 id 等于 1。
  3. 返回的结果应包括 id, name, age 三个字段。

SQL 解析 就是根据 SQL 语法规则解析并理解 SQL 语句的含义,明确这条语句的操作目的,如下图所示。

5  查询优化器:选择最优的查询路径

当解析器理解了 SQL 语句的目标后,接下来由 查询优化器(Optimizer) 来选择一个最优的查询路径,以确保查询执行效率最高。

让我们继续使用之前的例子:

SELECT id, name, age FROM users WHERE id = 1;

解析器已经理解到这是要从 users 表中找到 id 等于 1 的记录,并提取 id, name, age 三个字段。接下来,优化器就会根据不同的查询路径,选择最优的执行方案。以下是两个简单的路径示例(仅用于理解,并非实际 MySQL 机制):

路径 1:直接定位到 users 表中 id 等于 1 的那行数据,然后提取 id, name, age 三个字段。这通常是通过索引快速定位数据的方式,速度更快。
路径 2:遍历整个 users 表,逐行读取每条记录的 id, name, age,然后过滤出 id 等于 1 的那行数据。这个路径效率较低,因为需要扫描整个表。


虽然这两种路径都可以完成查询,但显然第一种路径更快、更高效。因此,查询优化器 的任务就是为你写的 SQL 语句生成一棵查询路径树,然后选择其中执行效率最高的一条路径。

通过选择最优路径,MySQL 会更高效地执行 SQL 语句,相当于优化器在后台帮你决定了以什么顺序和步骤完成查询,从而提高了整体查询性能。

6  调用存储引擎接口,真正执行SQL语句

最后一步是将查询优化器选择的最优查询路径,也就是 SQL 语句的执行计划,交给 MySQL 的底层 存储引擎 来执行。这是 MySQL 架构设计中一个非常重要且有特色的部分。

我们可以思考一下,SQL 语句执行的最终目的就是访问和操作数据。那么,数据究竟存放在哪里呢?

在 MySQL 中,数据既可能存放在内存中,也可能存放在磁盘文件中。具体来说:

  • 如果数据经常被访问,可能会被缓存在内存中,以便快速读取。
  • 较大的数据文件或冷数据则通常存放在磁盘中,通过存储引擎负责读取和写入。

存储引擎是 MySQL 系统与底层数据存储之间的接口,它负责管理数据的物理存储和检索。不同的存储引擎(如 InnoDB、MyISAM 等)具有不同的特性,决定了数据如何存储、更新、查询和处理。

现在我们知道 SQL 语句的执行步骤,但问题在于:如何确定哪些数据在内存中,哪些数据在磁盘上?当我们执行 SQL 语句时,是更新内存中的数据,还是直接更新磁盘上的数据?如果要更新磁盘上的数据,又是如何找到具体的磁盘文件并进行更新呢?

这时,存储引擎 就起到了关键作用。存储引擎负责具体的执行操作,包括查询内存缓存、更新磁盘数据、查询磁盘数据等。它按照一定的逻辑流程来处理数据,决定是否需要从磁盘中读取数据、将数据加载到内存中、或者在必要时更新磁盘中的数据。

存储引擎执行的流程可能如下:

  1. 首先检查数据是否已经在内存缓存中,如果是,则直接在内存中操作,避免频繁的磁盘读写。
  2. 如果数据不在内存中,存储引擎会从磁盘文件中读取相关数据,将其加载到内存中供查询或更新使用。
  3. 当需要更新数据时,存储引擎可能先更新内存中的缓存数据,然后根据策略(如事务提交或定期刷新)将数据写入磁盘。

存储引擎在执行这些操作时,还涉及到如何高效管理缓存、如何保持数据的一致性、以及如何在磁盘上优化读写性能。因此,它在整个 MySQL 的 SQL 语句执行过程中扮演了核心的角色。

MySQL的架构设计中,SQL接口、SQL解析器、查询优化器其实都是通用的,他就是一套组件而已。

但是存储引擎的话,他是支持各种各样的存储引擎的,比如我们常见的InnoDB、MyISAM、Memory等等,我们是可以选择使用哪种存储引擎来负责具体的SQL语句执行的。

目前,InnoDB 是 MySQL 默认且最常用的存储引擎,它支持事务、外键和行级锁,能够更好地满足现代数据库系统的需求。至于每种存储引擎的工作原理和内部机制,我们可以在后续深入分析,不必急于理解。

7  执行器:根据执行计划调用存储引擎的接口

在 MySQL 中,存储引擎负责处理数据的存取操作,比如访问内存和磁盘上的数据。然而,存储引擎并不会直接运行 SQL 语句,真正执行 SQL 语句的是 执行器

执行器 的作用是根据查询优化器生成的执行计划,调用存储引擎的接口,按步骤执行 SQL 语句的逻辑。执行器负责调度和控制 SQL 的执行流程,确保语句按照最优路径被正确执行。

例如,对于以下 SQL 语句:

SELECT id, name, age FROM users WHERE id = 1;

执行器的工作流程可能是这样的:
1. 执行器首先调用存储引擎的接口,从 `users` 表中获取第一行数据。
2. 执行器检查该行数据的 `id` 是否等于 1。
3. 如果 `id` 不等于 1,则执行器继续调用存储引擎接口,获取下一行数据。
4. 一旦找到 `id = 1` 的那行数据,执行器会提取 `id`, `name`, `age` 并返回结果。

执行器会不断调用存储引擎的接口,依次进行数据的读取、判断、过滤和操作,直至 SQL 语句的执行计划完全执行完毕。

通过执行器的调度,SQL 语句的执行顺序得以实现,确保每一步操作按照优化器的方案高效执行。

这篇关于MySQL 的基础 一 (连接池, SQL接口, 查询解析器, 查询优化器, 存储引擎接口, 执行器)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1138689

相关文章

LiteFlow轻量级工作流引擎使用示例详解

《LiteFlow轻量级工作流引擎使用示例详解》:本文主要介绍LiteFlow是一个灵活、简洁且轻量的工作流引擎,适合用于中小型项目和微服务架构中的流程编排,本文给大家介绍LiteFlow轻量级工... 目录1. LiteFlow 主要特点2. 工作流定义方式3. LiteFlow 流程示例4. LiteF

canal实现mysql数据同步的详细过程

《canal实现mysql数据同步的详细过程》:本文主要介绍canal实现mysql数据同步的详细过程,本文通过实例图文相结合给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的... 目录1、canal下载2、mysql同步用户创建和授权3、canal admin安装和启动4、canal

SQL中JOIN操作的条件使用总结与实践

《SQL中JOIN操作的条件使用总结与实践》在SQL查询中,JOIN操作是多表关联的核心工具,本文将从原理,场景和最佳实践三个方面总结JOIN条件的使用规则,希望可以帮助开发者精准控制查询逻辑... 目录一、ON与WHERE的本质区别二、场景化条件使用规则三、最佳实践建议1.优先使用ON条件2.WHERE用

MySQL存储过程之循环遍历查询的结果集详解

《MySQL存储过程之循环遍历查询的结果集详解》:本文主要介绍MySQL存储过程之循环遍历查询的结果集,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言1. 表结构2. 存储过程3. 关于存储过程的SQL补充总结前言近来碰到这样一个问题:在生产上导入的数据发现

SpringBoot集成LiteFlow实现轻量级工作流引擎的详细过程

《SpringBoot集成LiteFlow实现轻量级工作流引擎的详细过程》LiteFlow是一款专注于逻辑驱动流程编排的轻量级框架,它以组件化方式快速构建和执行业务流程,有效解耦复杂业务逻辑,下面给大... 目录一、基础概念1.1 组件(Component)1.2 规则(Rule)1.3 上下文(Conte

MySQL 衍生表(Derived Tables)的使用

《MySQL衍生表(DerivedTables)的使用》本文主要介绍了MySQL衍生表(DerivedTables)的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学... 目录一、衍生表简介1.1 衍生表基本用法1.2 自定义列名1.3 衍生表的局限在SQL的查询语句select

MySQL 横向衍生表(Lateral Derived Tables)的实现

《MySQL横向衍生表(LateralDerivedTables)的实现》横向衍生表适用于在需要通过子查询获取中间结果集的场景,相对于普通衍生表,横向衍生表可以引用在其之前出现过的表名,本文就来... 目录一、横向衍生表用法示例1.1 用法示例1.2 使用建议前面我们介绍过mysql中的衍生表(From子句

MybatisPlus service接口功能介绍

《MybatisPlusservice接口功能介绍》:本文主要介绍MybatisPlusservice接口功能介绍,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友... 目录Service接口基本用法进阶用法总结:Lambda方法Service接口基本用法MyBATisP

从基础到进阶详解Pandas时间数据处理指南

《从基础到进阶详解Pandas时间数据处理指南》Pandas构建了完整的时间数据处理生态,核心由四个基础类构成,Timestamp,DatetimeIndex,Period和Timedelta,下面我... 目录1. 时间数据类型与基础操作1.1 核心时间对象体系1.2 时间数据生成技巧2. 时间索引与数据

六个案例搞懂mysql间隙锁

《六个案例搞懂mysql间隙锁》MySQL中的间隙是指索引中两个索引键之间的空间,间隙锁用于防止范围查询期间的幻读,本文主要介绍了六个案例搞懂mysql间隙锁,具有一定的参考价值,感兴趣的可以了解一下... 目录概念解释间隙锁详解间隙锁触发条件间隙锁加锁规则案例演示案例一:唯一索引等值锁定存在的数据案例二: