听小董谝存储 八

2023-11-05 15:21
文章标签 存储 小董

本文主要是介绍听小董谝存储 八,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

序章

Dispatcher

Mover

几个问题


我爱glt

序章

前面几章,其实已经把这个存储系统的核心模块说清楚了。但是一些附属模块,例如dispatcher与mover还是没有讲。这一节,作为整个系统的最后一篇,就说说这两个模块。

Dispatcher

其实整个dispatcher的功能很简单的,就是发现集群里面的不稳定因素,然后找人处理而已。

那么具体什么情况算是不稳定因素呢?

  •       某个datashard的体积太大(单个datashard理论上可以达到一个卷的体积那么大)
  •       某个particle或者某个卷dead
  •       某个业务用的datashard太多了,需要合并
  •       某个业务用的datashard太少了,读写性能不够,需要分裂
  •       某组机器上占用的体积超过、少于平均值n个百分点

发生类似上面的情况,就说明数据需要发生搬迁分裂合并等操作了,然后dispatcher就计算应该几个并发,在不影响现网读写的情况下,指挥mover进行数据搬迁分裂合并。

完了,dispatcher的功能就是这么简单。那么再问一句,它所需要的原始数据从哪里来呢?答案就是Master。

Mover

前文已经不止一次说了mover的功能就是进行数据搬迁分裂与合并。

那咱们就以搬迁为例,说说它具体怎么操作。如下图一,就是particle的简略写数据流程。

                                              

 

                                                                                            图一 particle简略的写流程                       

具体搬迁的时候,Mover只需要把历史数据搬迁走就OK了,新增数据protal那一层已经采用了双写模式,不用担心。那具体的历史数据怎么读取呢。直接把要搬迁的data shard所属的block打包搬迁走就OK了。如下图二。

                       

 

                                                                                            图二 Mover执行搬迁任务

新的机器那边,收到一个block后,先放到自己的磁盘里,然后把里面的每一个值都解析一下,反向更新到索引节点里。

那搬迁什么时候算是个头呢?老的机器那边数据一直在下刷,一直有新的block产生。

那就在搬迁的过程中,禁止这个data shard的DataRegion下刷。

这样一来,历史的数据占据了几个磁盘里面的block就是确定的了,终归是能搬迁完的。

几个问题

  • 可是如果搬迁需要很长时间,然后数据又一直写,dataregion的长度不够了怎么办?

我们设定了搬迁的最长时间,绝大多数的data shard在这个时间内都能搬迁完成。

  • 那如果就是有一个data shard写入的速度很快,时间就是不够怎么办?

首先,因为整体的路由是经过hash的,所以data shard的写入频率是和它负责的区域长度相关的,如果一个data shard负责的范围太大,前面的dispatcher就会识别到这种问题,先一步进行数据分裂。如果真的dispatcher出问题了,导致有一个data shard的增长速度特别快,在给定的时间内不能搬迁完成,那就只能手动调整搬迁时间了。

 

这篇关于听小董谝存储 八的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/350754

相关文章

SpringBoot3.X 整合 MinIO 存储原生方案

《SpringBoot3.X整合MinIO存储原生方案》本文详细介绍了SpringBoot3.X整合MinIO的原生方案,从环境搭建到核心功能实现,涵盖了文件上传、下载、删除等常用操作,并补充了... 目录SpringBoot3.X整合MinIO存储原生方案:从环境搭建到实战开发一、前言:为什么选择MinI

Python实现对阿里云OSS对象存储的操作详解

《Python实现对阿里云OSS对象存储的操作详解》这篇文章主要为大家详细介绍了Python实现对阿里云OSS对象存储的操作相关知识,包括连接,上传,下载,列举等功能,感兴趣的小伙伴可以了解下... 目录一、直接使用代码二、详细使用1. 环境准备2. 初始化配置3. bucket配置创建4. 文件上传到os

Java中调用数据库存储过程的示例代码

《Java中调用数据库存储过程的示例代码》本文介绍Java通过JDBC调用数据库存储过程的方法,涵盖参数类型、执行步骤及数据库差异,需注意异常处理与资源管理,以优化性能并实现复杂业务逻辑,感兴趣的朋友... 目录一、存储过程概述二、Java调用存储过程的基本javascript步骤三、Java调用存储过程示

MySQL之InnoDB存储引擎中的索引用法及说明

《MySQL之InnoDB存储引擎中的索引用法及说明》:本文主要介绍MySQL之InnoDB存储引擎中的索引用法及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐... 目录1、背景2、准备3、正篇【1】存储用户记录的数据页【2】存储目录项记录的数据页【3】聚簇索引【4】二

MySQL之InnoDB存储页的独立表空间解读

《MySQL之InnoDB存储页的独立表空间解读》:本文主要介绍MySQL之InnoDB存储页的独立表空间,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、独立表空间【1】表空间大小【2】区【3】组【4】段【5】区的类型【6】XDES Entry区结构【

SQLite3 在嵌入式C环境中存储音频/视频文件的最优方案

《SQLite3在嵌入式C环境中存储音频/视频文件的最优方案》本文探讨了SQLite3在嵌入式C环境中存储音视频文件的优化方案,推荐采用文件路径存储结合元数据管理,兼顾效率与资源限制,小文件可使用B... 目录SQLite3 在嵌入式C环境中存储音频/视频文件的专业方案一、存储策略选择1. 直接存储 vs

MySQL存储过程之循环遍历查询的结果集详解

《MySQL存储过程之循环遍历查询的结果集详解》:本文主要介绍MySQL存储过程之循环遍历查询的结果集,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言1. 表结构2. 存储过程3. 关于存储过程的SQL补充总结前言近来碰到这样一个问题:在生产上导入的数据发现

MySQL 存储引擎 MyISAM详解(最新推荐)

《MySQL存储引擎MyISAM详解(最新推荐)》使用MyISAM存储引擎的表占用空间很小,但是由于使用表级锁定,所以限制了读/写操作的性能,通常用于中小型的Web应用和数据仓库配置中的只读或主要... 目录mysql 5.5 之前默认的存储引擎️‍一、MyISAM 存储引擎的特性️‍二、MyISAM 的主

Linux lvm实例之如何创建一个专用于MySQL数据存储的LVM卷组

《Linuxlvm实例之如何创建一个专用于MySQL数据存储的LVM卷组》:本文主要介绍使用Linux创建一个专用于MySQL数据存储的LVM卷组的实例,具有很好的参考价值,希望对大家有所帮助,... 目录在Centos 7上创建卷China编程组并配置mysql数据目录1. 检查现有磁盘2. 创建物理卷3. 创

使用Python实现调用API获取图片存储到本地的方法

《使用Python实现调用API获取图片存储到本地的方法》开发一个自动化工具,用于从JSON数据源中提取图像ID,通过调用指定API获取未经压缩的原始图像文件,并确保下载结果与Postman等工具直接... 目录使用python实现调用API获取图片存储到本地1、项目概述2、核心功能3、环境准备4、代码实现