听小董谝存储七

2023-11-05 15:21
文章标签 存储 小董

本文主要是介绍听小董谝存储七,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

序章

一些设定

关于WAL

恢复


我爱glt

序章

前面几章,我们已经明白了particle层的读写流程。但是我们还有问题如果机器断电了,数据怎么恢复。

一些设定

首先我们得先确定下面几个问题

1 什么时候需要恢复数据?

    当进程挂掉的时候

    当机器直接死机了

2 什么时候恢复的数据会真的被使用?

    我们有三个副本,当一个或者两个副本死掉了,我们会指向搬迁操作,把数据在新的地方变成新的三副本。只有当3个机器都死掉了,我们才需要使用恢复的数据。

3 哪些数据需要恢复?

                           

                                                                                  图一 particle层的数据分布

       如上图,我们先分析一下,图里面的几个模块都在什么地方。

       共享内存里:黄色的索引块,DataRegion里面的数据

       磁盘里:那就是已经下刷到磁盘里面的数据。

不管是否断电,磁盘里的数据都在,跑不了。我们不用管。

如果只是进程死掉了,那么进程重启的时候,只要重新把共享内存拉起来就能继续工作了。

如果是机器之间挂掉了,重新启动机器后,共享内存没有了。如果我们此时什么都不做,那我们面对的情况就是一个磁盘,磁盘里面有一堆数据,但是我压根不知道哪个key在哪个位置。

没有桥,老子就过不了河了么?

我tm绕着地球走一圈照样能过去!

就好像你给我一个没有了索引的字典,你让我怎么查?

没有索引的字典就不能查了么?

当然可以。我把字典的正文一页页的看,然后看到一个字就把它记录到索引里。我手动恢复索引不就OK了。

我们要恢复的其实就是内存里的索引。

                                                       

                                                                                         图二 丢失了索引

如上图二,我们没有任何数据索引。可是我们有BlockManager的索引,(前面每次下刷数据,回收block的时候,blockmanager的数据都会落盘)我们按照block生成的顺序从最早到最近依次遍历所有的block就能把数据索引反向补充回来。

                                                                         图三 根据blockManager 依次遍历block

图三有两个block里面都有DataB,该怎么处理呢?还需要说么?

搞定了,数据都恢复了。

恢复个屁!

还有一些数据在DataRegion里面呢,那些数据还没有进磁盘呢!断电就没有了。

关于WAL

刚才提到在dataregion里面的数据还没有下刷,都在内存里,断电自然就没有了。那么,咱们就把它们也放到磁盘里。写内存之前,就先放到磁盘里。也就是所谓的WAL(Write Ahead Log)。具体什么流程呢?如下图四的左半部分,就是数据在写入dataregion之前,就先写入缓存,如果缓存里面的数据大于8KB,就下刷到磁盘里的binlog文件里。 (这个文件在mysql里面叫redo log)

(有人说又要下刷磁盘,这恐怕对性能又损失。没办法,我们做的就是一个平衡的事情,而且顺序写ssd,速度也不是慢点不可接受,如果不下刷,或者说压根就不引人binlog机制,速度确实能快点,但是一旦断电就麻烦了) 

那磁盘里面的binlog得有多大?换句话说,binlog得保存多久。 看图四的右半部分。Binlog的长度不会大于dataregion的长度。每次从dataregion里面取数据下刷的时候,就会更新binlog的起点。

这样一来,任何时候断电,我们最多损失8KB的数据。(当然,我们也可以来一个数据,就顺序写一次binlog到ssd,但是前面也说了,这就是个平衡,你也可以当缓存大于80KB的时候下刷。)

                                                       

                                                                                  图四 引入wal的写流程                             

恢复

                      

                                                                    图五 恢复流程                        

主体流程就不解释了,你就想想你拿到一个只有正文的字典,怎么自己整理出索引。

关于最后还有一个设置服务状态,即使数据全部恢复了,也不会立即对外服务,需要后台开发任务手动设置一个标志位。毕竟三个机器都死的概率不大,真的需要从磁盘恢复数据的频率也不高,具体什么时候开始服务还是需要后台开发再评估一下的。

这篇关于听小董谝存储七的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/350752

相关文章

SpringBoot3.X 整合 MinIO 存储原生方案

《SpringBoot3.X整合MinIO存储原生方案》本文详细介绍了SpringBoot3.X整合MinIO的原生方案,从环境搭建到核心功能实现,涵盖了文件上传、下载、删除等常用操作,并补充了... 目录SpringBoot3.X整合MinIO存储原生方案:从环境搭建到实战开发一、前言:为什么选择MinI

Python实现对阿里云OSS对象存储的操作详解

《Python实现对阿里云OSS对象存储的操作详解》这篇文章主要为大家详细介绍了Python实现对阿里云OSS对象存储的操作相关知识,包括连接,上传,下载,列举等功能,感兴趣的小伙伴可以了解下... 目录一、直接使用代码二、详细使用1. 环境准备2. 初始化配置3. bucket配置创建4. 文件上传到os

Java中调用数据库存储过程的示例代码

《Java中调用数据库存储过程的示例代码》本文介绍Java通过JDBC调用数据库存储过程的方法,涵盖参数类型、执行步骤及数据库差异,需注意异常处理与资源管理,以优化性能并实现复杂业务逻辑,感兴趣的朋友... 目录一、存储过程概述二、Java调用存储过程的基本javascript步骤三、Java调用存储过程示

MySQL之InnoDB存储引擎中的索引用法及说明

《MySQL之InnoDB存储引擎中的索引用法及说明》:本文主要介绍MySQL之InnoDB存储引擎中的索引用法及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录1、背景2、准备3、正篇【1】存储用户记录的数据页【2】存储目录项记录的数据页【3】聚簇索引【4】二

MySQL之InnoDB存储页的独立表空间解读

《MySQL之InnoDB存储页的独立表空间解读》:本文主要介绍MySQL之InnoDB存储页的独立表空间,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、独立表空间【1】表空间大小【2】区【3】组【4】段【5】区的类型【6】XDES Entry区结构【

SQLite3 在嵌入式C环境中存储音频/视频文件的最优方案

《SQLite3在嵌入式C环境中存储音频/视频文件的最优方案》本文探讨了SQLite3在嵌入式C环境中存储音视频文件的优化方案,推荐采用文件路径存储结合元数据管理,兼顾效率与资源限制,小文件可使用B... 目录SQLite3 在嵌入式C环境中存储音频/视频文件的专业方案一、存储策略选择1. 直接存储 vs

MySQL存储过程之循环遍历查询的结果集详解

《MySQL存储过程之循环遍历查询的结果集详解》:本文主要介绍MySQL存储过程之循环遍历查询的结果集,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言1. 表结构2. 存储过程3. 关于存储过程的SQL补充总结前言近来碰到这样一个问题:在生产上导入的数据发现

MySQL 存储引擎 MyISAM详解(最新推荐)

《MySQL存储引擎MyISAM详解(最新推荐)》使用MyISAM存储引擎的表占用空间很小,但是由于使用表级锁定,所以限制了读/写操作的性能,通常用于中小型的Web应用和数据仓库配置中的只读或主要... 目录mysql 5.5 之前默认的存储引擎️‍一、MyISAM 存储引擎的特性️‍二、MyISAM 的主

Linux lvm实例之如何创建一个专用于MySQL数据存储的LVM卷组

《Linuxlvm实例之如何创建一个专用于MySQL数据存储的LVM卷组》:本文主要介绍使用Linux创建一个专用于MySQL数据存储的LVM卷组的实例,具有很好的参考价值,希望对大家有所帮助,... 目录在Centos 7上创建卷China编程组并配置mysql数据目录1. 检查现有磁盘2. 创建物理卷3. 创

使用Python实现调用API获取图片存储到本地的方法

《使用Python实现调用API获取图片存储到本地的方法》开发一个自动化工具,用于从JSON数据源中提取图像ID,通过调用指定API获取未经压缩的原始图像文件,并确保下载结果与Postman等工具直接... 目录使用python实现调用API获取图片存储到本地1、项目概述2、核心功能3、环境准备4、代码实现