Raft分区产生的脏读问题

2024-08-22 13:44
文章标签 问题 分区 产生 raft 脏读

本文主要是介绍Raft分区产生的脏读问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Raft分区产生的脏读问题

  • 前言
  • 网络分区
    • 情况1 4和5分到一个分区,即当前leader依然在多数分区
    • 情况2 1和2分到一个分区,即当前leader在少数分区
  • 脏读问题的解决
    • 官方解答
    • 其他论文
  • 参考链接

前言

昨天面试阿里云被问到了这个问题,在此记录一下。

网络分区

有一个raft集群如下所示,然后发生网络分区:

在这里插入图片描述

情况1 4和5分到一个分区,即当前leader依然在多数分区

此时4 5收不到leader的心跳,成为candidate后由于得不到多数票所以选举失败,都不会成为leader

这种情况下,客户的读写请求还是会发送给leader节点1,依然能够正常读写。

情况2 1和2分到一个分区,即当前leader在少数分区

此时在另一个多数节点存在的分区一定会选举出一个新Leader,比如3当选为新leader,此时3的term会为原来的1的term+1,而1依然是leader,term不会发生变化。
在这里插入图片描述
这时,客户端发生读写请求会有以下几种情况:

  • 对1的写请求:1接收写请求后append log entry到followers,但只能与2通信,因此得不到多数节点的成功返回,这个请求会处于uncommited状态
  • 对3的写请求:3的写请求可以得到多数节点的响应,因此能够正确返回
  • 对3的读请求:3的term更新,能够直接从3读取更新的数据
  • 对1的读请求:有可能出现脏读

脏读问题的解决

官方解答

针对脏读问题问题,官方给的方案是需要额外2个额外的措施来保证:

1、领导人必须有关于被提交日志的最新信息

即在它的任期里必须马上提交一条空白的日志条目,即心跳;

这段话的意思是在一个节点成为Leader之前,至少向多数节点发送一次心跳来进行确认日志情况,在没收到心跳响应之前是不能响应客户端的;

2、领导人在处理只读的请求之前必须检查自己是否已经被废除了

具体实现是Leader在响应只读请求之前,先和集群中的大多数节点交换一次心跳信息来处理这个问题,即发送一次心跳的RPC,收到响应无误之后才能返回给客户端,即每次读请求要和多数成员做一次心跳以确认自己仍然是 Leader。

其他论文

除此之外,为了解决分区读产生的脏读问题,在论文 通过 raft 的 leader lease 来解决集群脑裂时的 stale read 问题中提出了region leader的概念。

对整个系统引入一个唯一的region leader,所有的读写请求都必须在region leader上进行,region leader可以和raft集群的leader不同,此时需要将读写请求重定向给raft leader

对于上述分区结果,有以下几种情况;

  • region leader和1.2在同一分区,此时3 4 5的多数分区会产生一个新的region leader,而老的region leader由于联系不上多数节点,只能等到lease过期,最新的读写会通过最新的region leader来进行(这里存疑,因为不知道region leader选举的具体过程,也没找到论文的原文,感觉可能是region leader会进行某种检查来判定自己是否可用)
  • regon leader和3,4,5在同一分区:此时会选举出一个新的raft leader, region leader的读写请求会发送给新的raft leader,实现最新数据的读取

参考链接

1: https://segmentfault.com/a/1190000038171007
2: https://blog.csdn.net/chdhust/article/details/77829103

这篇关于Raft分区产生的脏读问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1096441

相关文章

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

kkFileView启动报错:报错2003端口占用的问题及解决

《kkFileView启动报错:报错2003端口占用的问题及解决》kkFileView启动报错因office组件2003端口未关闭,解决:查杀占用端口的进程,终止Java进程,使用shutdown.s... 目录原因解决总结kkFileViewjavascript启动报错启动office组件失败,请检查of

SpringBoot 异常处理/自定义格式校验的问题实例详解

《SpringBoot异常处理/自定义格式校验的问题实例详解》文章探讨SpringBoot中自定义注解校验问题,区分参数级与类级约束触发的异常类型,建议通过@RestControllerAdvice... 目录1. 问题简要描述2. 异常触发1) 参数级别约束2) 类级别约束3. 异常处理1) 字段级别约束

Python错误AttributeError: 'NoneType' object has no attribute问题的彻底解决方法

《Python错误AttributeError:NoneTypeobjecthasnoattribute问题的彻底解决方法》在Python项目开发和调试过程中,经常会碰到这样一个异常信息... 目录问题背景与概述错误解读:AttributeError: 'NoneType' object has no at

Spring的RedisTemplate的json反序列泛型丢失问题解决

《Spring的RedisTemplate的json反序列泛型丢失问题解决》本文主要介绍了SpringRedisTemplate中使用JSON序列化时泛型信息丢失的问题及其提出三种解决方案,可以根据性... 目录背景解决方案方案一方案二方案三总结背景在使用RedisTemplate操作redis时我们针对

Kotlin Map映射转换问题小结

《KotlinMap映射转换问题小结》文章介绍了Kotlin集合转换的多种方法,包括map(一对一转换)、mapIndexed(带索引)、mapNotNull(过滤null)、mapKeys/map... 目录Kotlin 集合转换:map、mapIndexed、mapNotNull、mapKeys、map

nginx中端口无权限的问题解决

《nginx中端口无权限的问题解决》当Nginx日志报错bind()to80failed(13:Permissiondenied)时,这通常是由于权限不足导致Nginx无法绑定到80端口,下面就来... 目录一、问题原因分析二、解决方案1. 以 root 权限运行 Nginx(不推荐)2. 为 Nginx

解决1093 - You can‘t specify target table报错问题及原因分析

《解决1093-Youcan‘tspecifytargettable报错问题及原因分析》MySQL1093错误因UPDATE/DELETE语句的FROM子句直接引用目标表或嵌套子查询导致,... 目录报js错原因分析具体原因解决办法方法一:使用临时表方法二:使用JOIN方法三:使用EXISTS示例总结报错原

Windows环境下解决Matplotlib中文字体显示问题的详细教程

《Windows环境下解决Matplotlib中文字体显示问题的详细教程》本文详细介绍了在Windows下解决Matplotlib中文显示问题的方法,包括安装字体、更新缓存、配置文件设置及编码調整,并... 目录引言问题分析解决方案详解1. 检查系统已安装字体2. 手动添加中文字体(以SimHei为例)步骤

SpringSecurity整合redission序列化问题小结(最新整理)

《SpringSecurity整合redission序列化问题小结(最新整理)》文章详解SpringSecurity整合Redisson时的序列化问题,指出需排除官方Jackson依赖,通过自定义反序... 目录1. 前言2. Redission配置2.1 RedissonProperties2.2 Red