【数据库】数据库并发控制的目标,可串行化序列的分析,并发控制调度器模型

2023-12-01 23:28

本文主要是介绍【数据库】数据库并发控制的目标,可串行化序列的分析,并发控制调度器模型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

数据库并发控制

专栏内容

  • 手写数据库toadb
    本专栏主要介绍如何从零开发,开发的步骤,以及开发过程中的涉及的原理,遇到的问题等,让大家能跟上并且可以一起开发,让每个需要的人成为参与者。
    本专栏会定期更新,对应的代码也会定期更新,每个阶段的代码会打上tag,方便阶段学习。

开源贡献

  • toadb开源库

个人主页:我的主页
管理社区:开源数据库
座右铭:天行健,君子以自强不息;地势坤,君子以厚德载物.

文章目录

  • 数据库并发控制
  • 前言
  • 概述
  • 并发调度器
  • 可串行化
    • 可串行化概念
    • 案例分析
  • 可串行化的模型
  • 总结
  • 结尾

在这里插入图片描述

前言

随着信息技术的飞速发展,数据已经渗透到各个领域,成为现代社会最重要的资产之一。在这个大数据时代,数据库理论在数据管理、存储和处理中发挥着至关重要的作用。然而,很多读者可能对数据库理论感到困惑,不知道如何选择合适的数据库,如何设计有效的数据库结构,以及如何处理和管理大量的数据。因此,本专栏旨在为读者提供一套全面、深入的数据库理论指南,帮助他们更好地理解和应用数据库技术。

数据库理论是研究如何有效地管理、存储和检索数据的学科。在现代信息化社会中,数据量呈指数级增长,如何高效地处理和管理这些数据成为一个重要的问题。同时,随着云计算、物联网、大数据等新兴技术的不断发展,数据库理论的重要性日益凸显。

因此,本专栏的分享希望可以提高大家对数据库理论的认识和理解,对于感兴趣的朋友带来帮助。

概述

数据库同一时间会运行很多的事务,有客户端发起的,也有数据库系统内部产生的,那么这事务的并发执行,相互之间的影响会导致数据库的状态不一致;

虽然每个事务的执行状态都是正确的,而且也没有发生故障和错误,但也没法确保数据正确。

这就需要数据库进行统一协调,让各个事务并发执行时,按照一定的规范来让它们有次序的执行,这就是数据库中的调度器需要做的事。

本文就来聊聊数据库的并发调度器的那些事。

并发调度器

数据库调度器让并发执行的事务,保持数据库状态一致的过程,就是并发控制。

当事务执行时,需要对数据库元素进行读写,这时就会向调度器请求,大多数情况下,调度器都会直接进行读写处理;如果数据库元素没有在缓冲区时,先向缓冲区管理器进行请求,让它加载到缓冲区中。

而在某些情况下,立即执行是不安全的,调度器会延迟这些请求,有些并发控制技术中,调度器甚至会拒绝,导至事务的中止。

可串行化

调度器如何判断执行的安全性,也就是并发执行事务保持数据库状态的一致性,在数据库中叫做可串行化;

当然还有另一种更强,更重要的条件,叫做冲突的可串行化,这是大多数数据库真正实现的调度器。

可串行化概念

当一个事务在隔离状态下执行时(即没有其它事务与它并发执行),将数据库从任何一个状态转换为另一个一致的状态;通常都会有其它事务与它并发,所以这种原则没法适用。

所以我们需要一种可串行化调度的策略,让并发事务可串行化调度执行的结果,与一次执行一个事务产生的结果相同,那么这个调度产生的执行动作的序列,就叫做可串行化的调度。

案例分析

假设有两个事务T1,T2,操作对角为数据A和数据B,初始值都是25;
每个事务在执行计算时,会先读出数据,再修改,然后写回;

  • 事务执行序列为T1执行完,再执行T2
事务T1事务T2数据A数据B
2525
read(A,t)
t = t + 100
write(A,t)125
read(B,t)
t = t + 100
write(B,t)125
read(A,t)
t = t*2
write(A,t)250
read(B,t)
t = t*2
write(B,t)250
  • 事务执行序列为T2执行完,再执行T1
事务T1事务T2数据A数据B
2525
read(A,t)
t = t*2
write(A,t)50
read(B,t)
t = t*2
write(B,t)50
read(A,t)
t = t + 100
write(A,t)150
read(B,t)
t = t + 100
write(B,t)150

从这两个事务的执行序列来看,初始状态一样,但是在不同的执行顺序下执行后的状态确不一样。两个事务串行执行的结果,与两个事务执行的顺序相关。

以上是两个事务串行执行的结果,当事务并发时,结果与串行执行一样吗?

  • 两个事务并发执行中的一种可能序列
事务T1事务T2数据A数据B
2525
read(A,t)
t = t + 100
write(A,t)125
read(A,t)
t = t*2
write(A,t)250
read(B,t)
t = t*2
write(B,t)50
read(B,t)
t = t + 100
write(B,t)150

显然这次调度后的执行序列,得到的结果A=250,B=150,与上面两个事务串行执行的结果都不一样,最终状态是不一致的,所以这种调度是不可串行化的。

如何做到调度之后的可串行化,数据库通过可串行化的模型达到这一目标。

可串行化的模型

如果让多个事务简单的按装顺序来依次串行执行,一定是可以达到一致性的结果。多个事务的动作可以交叉,同时又与依次执行结果一样,这样的串行调度方式可以更高效的完成业务处理。

在大多数数据库中,采用封锁,时间戳和有效性确认,这三种方式组成的模型来达到并发事务可串行化,保证事务的特性。

总结

数据库并发控制的目标是,事务并发执行时,它们的执行序列可串行化,数据库的状态保持一致性。
在C语言中实现访问者模式,我们可以先定义一些结构体来表示元素对象和访问者对象。元素对象可以被访问者访问,而访问者对象可以访问元素对象并执行一些操作。

以下是一个简单的示例,其中定义了一个字符串类型的元素对象和一个输出字符串的访问者对象。在主函数中,我们创建了一个字符串类型的元素对象,然后使用访问者对象来访问它并输出 “Hello, world!”。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>// 定义字符串类型的元素对象
typedef struct Element {char* str;
} Element;// 定义输出字符串的访问者对象
typedef struct Visitor {void (*visit)(Element*);
} Visitor;// 定义一个函数,用于创建字符串类型的元素对象
Element* create_element(const char* str) {Element* element = (Element*)malloc(sizeof(Element));element->str = (char*)malloc(strlen(str) + 1);strcpy(element->str, str);return element;
}// 定义一个函数,用于销毁字符串类型的元素对象
void destroy_element(Element* element) {free(element->str);free(element);
}// 定义一个函数,用于执行输出字符串的操作
void visit_element(Visitor* visitor, Element* element) {visitor->visit(element);
}// 定义一个函数,用于创建输出字符串的访问者对象
Visitor* create_visitor() {Visitor* visitor = (Visitor*)malloc(sizeof(Visitor));visitor->visit = (void (*)(Element*))printf;return visitor;
}// 定义一个函数,用于销毁输出字符串的访问者对象
void destroy_visitor(Visitor* visitor) {free(visitor);
}int main() {// 创建一个字符串类型的元素对象,并赋值 "Hello, world!"Element* element = create_element("Hello, world!");// 创建一个输出字符串的访问者对象Visitor* visitor = create_visitor();// 使用访问者对象访问元素对象并输出 "Hello, world!"visit_element(visitor, element);// 销毁元素对象和访问者对象,释放内存资源destroy_element(element);destroy_visitor(visitor);return 0;
}

结尾

非常感谢大家的支持,在浏览的同时别忘了留下您宝贵的评论,如果觉得值得鼓励,请点赞,收藏,我会更加努力!

作者邮箱:study@senllang.onaliyun.com
如有错误或者疏漏欢迎指出,互相学习。

这篇关于【数据库】数据库并发控制的目标,可串行化序列的分析,并发控制调度器模型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/443092

相关文章

MySQL数据库双机热备的配置方法详解

《MySQL数据库双机热备的配置方法详解》在企业级应用中,数据库的高可用性和数据的安全性是至关重要的,MySQL作为最流行的开源关系型数据库管理系统之一,提供了多种方式来实现高可用性,其中双机热备(M... 目录1. 环境准备1.1 安装mysql1.2 配置MySQL1.2.1 主服务器配置1.2.2 从

SpringBoot基于注解实现数据库字段回填的完整方案

《SpringBoot基于注解实现数据库字段回填的完整方案》这篇文章主要为大家详细介绍了SpringBoot如何基于注解实现数据库字段回填的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解... 目录数据库表pom.XMLRelationFieldRelationFieldMapping基础的一些代

Nginx分布式部署流程分析

《Nginx分布式部署流程分析》文章介绍Nginx在分布式部署中的反向代理和负载均衡作用,用于分发请求、减轻服务器压力及解决session共享问题,涵盖配置方法、策略及Java项目应用,并提及分布式事... 目录分布式部署NginxJava中的代理代理分为正向代理和反向代理正向代理反向代理Nginx应用场景

Redis中的有序集合zset从使用到原理分析

《Redis中的有序集合zset从使用到原理分析》Redis有序集合(zset)是字符串与分值的有序映射,通过跳跃表和哈希表结合实现高效有序性管理,适用于排行榜、延迟队列等场景,其时间复杂度低,内存占... 目录开篇:排行榜背后的秘密一、zset的基本使用1.1 常用命令1.2 Java客户端示例二、zse

基于Python开发Windows自动更新控制工具

《基于Python开发Windows自动更新控制工具》在当今数字化时代,操作系统更新已成为计算机维护的重要组成部分,本文介绍一款基于Python和PyQt5的Windows自动更新控制工具,有需要的可... 目录设计原理与技术实现系统架构概述数学建模工具界面完整代码实现技术深度分析多层级控制理论服务层控制注

Redis中的AOF原理及分析

《Redis中的AOF原理及分析》Redis的AOF通过记录所有写操作命令实现持久化,支持always/everysec/no三种同步策略,重写机制优化文件体积,与RDB结合可平衡数据安全与恢复效率... 目录开篇:从日记本到AOF一、AOF的基本执行流程1. 命令执行与记录2. AOF重写机制二、AOF的

MyBatis Plus大数据量查询慢原因分析及解决

《MyBatisPlus大数据量查询慢原因分析及解决》大数据量查询慢常因全表扫描、分页不当、索引缺失、内存占用高及ORM开销,优化措施包括分页查询、流式读取、SQL优化、批处理、多数据源、结果集二次... 目录大数据量查询慢的常见原因优化方案高级方案配置调优监控与诊断总结大数据量查询慢的常见原因MyBAT

分析 Java Stream 的 peek使用实践与副作用处理方案

《分析JavaStream的peek使用实践与副作用处理方案》StreamAPI的peek操作是中间操作,用于观察元素但不终止流,其副作用风险包括线程安全、顺序混乱及性能问题,合理使用场景有限... 目录一、peek 操作的本质:有状态的中间操作二、副作用的定义与风险场景1. 并行流下的线程安全问题2. 顺

Java JUC并发集合详解之线程安全容器完全攻略

《JavaJUC并发集合详解之线程安全容器完全攻略》Java通过java.util.concurrent(JUC)包提供了一整套线程安全的并发容器,它们不仅是简单的同步包装,更是基于精妙并发算法构建... 目录一、为什么需要JUC并发集合?二、核心并发集合分类与详解三、选型指南:如何选择合适的并发容器?在多

Java 结构化并发Structured Concurrency实践举例

《Java结构化并发StructuredConcurrency实践举例》Java21结构化并发通过作用域和任务句柄统一管理并发生命周期,解决线程泄漏与任务追踪问题,提升代码安全性和可观测性,其核心... 目录一、结构化并发的核心概念与设计目标二、结构化并发的核心组件(一)作用域(Scopes)(二)任务句柄