Redis原理篇(Dict的收缩扩容机制和渐进式rehash)

2024-01-09 00:20

文章标签 redis 机制 dict 扩容收缩原理篇渐进式 rehash

本文主要是介绍Redis原理篇(Dict的收缩扩容机制和渐进式rehash)，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

Dict（即字典）

Redis是一种键值型数据库，其中键与值的映射关系就是Dict实现的。

Dict通过三部分组成：哈希表（DictHashTable），哈希节点(DictEntry)，字典（Dict）

其中哈希表的底层是数组（发生冲突时扩展成链表），用来存放哈希节点。

下面是哈希表和哈希节点的源码

首先看到dictht,即DictHashTable的缩写，下面是对其中属性的解释：

dictEntry **table是哈希表的数组，每个元素都是一个指向 dictEntry 结构体的指针。这里使用双指针 ** 的原因是为了实现动态数组。

size是哈希表的大小

sizemask是用来对键值进行与运算（与取余结果一致，但是用与运算更快）。

used是节点个数

然后看到dictEntry，是节点，下面是对其中属性的解释：

key是键很好理解;

union是一个联合函数，意思是v可以是{}里面的任意一个值。

注意：发生hash冲突时，新元素添加在链表首位，再让新元素的next指向原来的链表的头，这样比较方便，如果把新元素添加到链表尾部的话要对链表进行变量，很麻烦。

Dict的扩容

Dict是通过数组和单向链表实现的，当存放数据越来越多，导致大量的哈希冲突，使得链表长度过长，这样的话查询效率就大打折扣。出现这种情况的根本原因是数组小了，所有解决方案就是对数组进行扩容。

负载因子 =节点个数/数组大小

下面是包含扩容的代码

Dict的收缩

除了扩容外，当出现频繁的删除造成entry个数较少，而数组大小过大的资源浪费的情况时，就需要对Dict进行收缩，收缩的条件是：

下面是Dict收缩的代码

可以看到收缩和扩容以及Dict初始化时都用到了dictExpand这个函数，主要的逻辑还是在这个函数里面的，所有我们来看看这个函数源码：

注意到这里有个rehash的操作，为什么要进行这个操作呢？

扩容和收缩不就是改变数组的大小吗？直接改不就行了？

显然，这样是不行的，因为Dict的删除，查询，更改都是要通过键值来找到对应entry的，当我数组的大小改变，那么我使用原来的hash函数运算得到的就不是原来的那个key了。

因为key的查询与sizemask有关，这个sizemask变化了，那么就当然得不到原本的那个key。

再注意到，这个dictExpand函数内部并没有进行具体的rehash的操作，

只是将rehashidx赋值为了0，

这个rehashidx还有印象吗？我帮忙回忆一下：

没错，就是这个rehash的进度。

那为什么不在dictExpand函数里面一次性将ht[0]全部赋值给ht[1]呢？

答案如下：

Rehash

但是渐进式rehash也有个问题，就是每次增删改查都只迁移一个entry链表（包含key对应的entry以及由hash冲突导致生成的链表），这个进度是比较缓慢的，那在增删改查的时候会遇到问题，因为此时数据在2张表里面，ht[0]和ht[1],怎么办？

其实也很简单，首先在新增的时候肯定是将新的entry给ht[1],因为要是写进了ht[0],到时候还是要给ht[1];

然后是删除，更改，查询，这两张表都访问一遍就行了。数据反正不在ht[0]就在ht[1]。

因为是使用指针这种数据结构，从ht[0]迁移到ht[1]就是改个指针指向的操作就行，很方便，并且改变了指针的指向后，ht[0]里面就查不到移走的那个entry链表了，不用考虑是否要在ht[0]里面删除一次再到ht[1]里面删除一次的问题。

这里有个演示可以看一下：

1.size是4，现在又第5个元素要加进来,并且后台没有进行resave等操作,开始进行扩容操作

2.现在元素个数是5，比5大一是6，第一个比6大的2的n次方是8，

申请内存空间，大小是8个entry赋值给ht[1]

3.把rehashidx赋值为0，表示可以开始rehash

4.在增删改查时发现rehashidx不是-1，就从ht[rehashidx]开始，一个一个迁移到ht[1]

5.迁移完毕后就将ht[1]下的新的hash表转移到ht[0],再将rehashidx赋值-1,还有size等属性也要更改，ht[1]的size,sizemask,used重新置为0，hash表置为null

至此，rehash完成

这篇关于Redis原理篇(Dict的收缩扩容机制和渐进式rehash)的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/585345。 23002807@qq.com

相关文章

Redis 基本数据类型和使用详解

Redis 基本数据类型和使用详解

《Redis基本数据类型和使用详解》String是Redis最基本的数据类型,一个键对应一个值,它的功能十分强大,可以存储字符串、整数、浮点数等多种数据格式,本文给大家介绍Redis基本数据类型和... 目录一、Redis 入门介绍二、Redis 的五大基本数据类型2.1 String 类型2.2 Hash

阅读更多...

Redis中Hash从使用过程到原理说明

Redis中Hash从使用过程到原理说明

《Redis中Hash从使用过程到原理说明》RedisHash结构用于存储字段-值对,适合对象数据,支持HSET、HGET等命令,采用ziplist或hashtable编码,通过渐进式rehash优化... 目录一、开篇：Hash就像超市的货架二、Hash的基本使用1. 常用命令示例2. Java操作示例三

阅读更多...

Redis中Set结构使用过程与原理说明

Redis中Set结构使用过程与原理说明

《Redis中Set结构使用过程与原理说明》本文解析了RedisSet数据结构,涵盖其基本操作（如添加、查找）、集合运算（交并差）、底层实现（intset与hashtable自动切换机制）、典型应用场... 目录开篇：从购物车到Redis Set一、Redis Set的基本操作1.1 编程常用命令1.2 集

阅读更多...

Redis中的有序集合zset从使用到原理分析

Redis中的有序集合zset从使用到原理分析

《Redis中的有序集合zset从使用到原理分析》Redis有序集合(zset)是字符串与分值的有序映射,通过跳跃表和哈希表结合实现高效有序性管理,适用于排行榜、延迟队列等场景,其时间复杂度低,内存占... 目录开篇：排行榜背后的秘密一、zset的基本使用1.1 常用命令1.2 Java客户端示例二、zse

阅读更多...

Redis中的AOF原理及分析

Redis中的AOF原理及分析

《Redis中的AOF原理及分析》Redis的AOF通过记录所有写操作命令实现持久化,支持always/everysec/no三种同步策略,重写机制优化文件体积,与RDB结合可平衡数据安全与恢复效率... 目录开篇：从日记本到AOF一、AOF的基本执行流程1. 命令执行与记录2. AOF重写机制二、AOF的

阅读更多...

解决docker目录内存不足扩容处理方案

解决docker目录内存不足扩容处理方案

《解决docker目录内存不足扩容处理方案》文章介绍了Docker存储目录迁移方法：因系统盘空间不足,需将Docker数据迁移到更大磁盘（如/home/docker）,通过修改daemon.json配... 目录1、查看服务器所有磁盘的使用情况2、查看docker镜像和容器存储目录的空间大小3、停止dock

阅读更多...

JAVA实现Token自动续期机制的示例代码

JAVA实现Token自动续期机制的示例代码

《JAVA实现Token自动续期机制的示例代码》本文主要介绍了JAVA实现Token自动续期机制的示例代码,通过动态调整会话生命周期平衡安全性与用户体验,解决固定有效期Token带来的风险与不便,感兴... 目录1. 固定有效期Token的内在局限性2. 自动续期机制：兼顾安全与体验的解决方案3. 总结PS

阅读更多...

详解Spring中REQUIRED事务的回滚机制详解

详解Spring中REQUIRED事务的回滚机制详解

《详解Spring中REQUIRED事务的回滚机制详解》在Spring的事务管理中,REQUIRED是最常用也是默认的事务传播属性,本文就来详细的介绍一下Spring中REQUIRED事务的回滚机制,... 目录1. REQUIRED 的定义2. REQUIRED 下的回滚机制2.1 异常触发回滚2.2 回

阅读更多...

Redis高性能Key-Value存储与缓存利器常见解决方案

Redis高性能Key-Value存储与缓存利器常见解决方案

《Redis高性能Key-Value存储与缓存利器常见解决方案》Redis是高性能内存Key-Value存储系统,支持丰富数据类型与持久化方案（RDB/AOF）,本文给大家介绍Redis高性能Key-... 目录Redis：高性能Key-Value存储与缓存利器什么是Redis？为什么选择Redis？Red

阅读更多...

Redis 的 SUBSCRIBE命令详解

Redis 的 SUBSCRIBE命令详解

《Redis的SUBSCRIBE命令详解》Redis的SUBSCRIBE命令用于订阅一个或多个频道,以便接收发送到这些频道的消息,本文给大家介绍Redis的SUBSCRIBE命令,感兴趣的朋友跟随... 目录基本语法工作原理示例消息格式相关命令python 示例Redis 的 SUBSCRIBE 命令用于订

阅读更多...