Redis 源码分析(二) 一个 rehash 也不阻塞的哈希表

2024-08-22 09:38

本文主要是介绍Redis 源码分析(二) 一个 rehash 也不阻塞的哈希表,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Redis 的架构设计挺巧妙的,舍弃了主流的多线程架构,别出心裁的使用单线程架构,说实话,作为一个 kv,我一开始认为多线程并行的访问应该是一个默认选项,但是 Redis 的高效,用事实证明,这显然不是。这个单线程的事件系统另开一坑再聊吧,今天主要是看一下这个有趣的哈希表。

typedef struct dict {dictType *type;void *privdata;dictht ht[2];int rehashidx; /* rehashing not in progress if rehashidx == -1 */int iterators; /* number of iterators currently running */
} dict;

这就是 Redis 里面存哈希表的数据结构,真正的哈希表是哪个 dictht,dictht[0] 是一个哈希表,dictht[1] 是另一个哈希表。这里两个哈希表的设计主要是为了完成一个操作—— rehash,并且是不阻塞的 rehash。
哈希表中最耗时的操作就是 rehash 了,作为一个单线程生物,Redis 不会另外开一个线程去搞这个事情,增删改查还有 rehash 都在一个线程里跑,那么如何能让 rehash 的过程不影响其他的操作呢?
我们来随便找一个哈希表的操作函数,就拿哈希表的查找函数来讲吧

dictEntry *dictFind(dict *d, const void *key)
{dictEntry *he;unsigned int h, idx, table;if (d->ht[0].size == 0) return NULL; /* We don't have a table at all */if (dictIsRehashing(d)) _dictRehashStep(d);// 注意h = dictHashKey(d, key);for (table = 0; table <= 1; table++) {idx = h & d->ht[table].sizemask;he = d->ht[table].table[idx];while(he) {if (dictCompareHashKeys(d, key, he->key))return he;he = he->next;}if (!dictIsRehashing(d)) return NULL;}return NULL;
}

如果你看了我上一篇文章的话,这个函数应该已经见过了,同样不需要看整个函数,只需要看我标注的地方就好了,就一行,意思呢,很明白,这个哈希表是不是在 rehash 呀?如果是的话执行 _dictRehashStep 这个函数(开头加了个 _ 这个符号,假装私有函数。。)这个函数是什么意思呢?

static void _dictRehashStep(dict *d) {if (d->iterators == 0) dictRehash(d,1);
}

里面那个 dictRehash 是执行 rehash 的地方,直接进来

int dictRehash(dict *d, int n) {if (!dictIsRehashing(d)) return 0;while(n--) {dictEntry *de, *nextde;/* Check if we already rehashed the whole table... */if (d->ht[0].used == 0) {_dictFree(d->ht[0].table);d->ht[0] = d->ht[1];_dictReset(&d->ht[1]);d->rehashidx = -1;return 0;}/* Note that rehashidx can't overflow as we are sure there are more* elements because ht[0].used != 0 */while(d->ht[0].table[d->rehashidx] == NULL) d->rehashidx++;de = d->ht[0].table[d->rehashidx];/* Move all the keys in this bucket from the old to the new hash HT 简单说就是找到我们该搬的桶,搬空它,然后结束战斗,就只搬一个桶*/while(de) {unsigned int h;nextde = de->next;/* Get the index in the new hash table */h = dictHashKey(d, de->key) & d->ht[1].sizemask;de->next = d->ht[1].table[h];d->ht[1].table[h] = de;d->ht[0].used--;d->ht[1].used++;de = nextde;}d->ht[0].table[d->rehashidx] = NULL;d->rehashidx++;}return 1;
}

上文代码中的中文应该很引人注目(因为代码还是不如人话好懂啊~),这里这个函数就是找到这个哈希表中需要被搬运的第一个桶,然后把这个桶里面的所有项一个个重新哈希一下,搬到第二个哈希表中,就是从 dictht 中的 ht[0] 搬运到 ht[1],然后结束之后,指针交换一下就可以了呀。
既然了解了这个搬运工函数的作用,我们来看一下哪些部分调用了这个函数呢?
dictAdd
dictFind
dictGenericDelete
增删改查(改是先删再add)里面都用到了呀,也就是在线上不停的增删改查中不知不觉就 rehash 完了,一个 O(n) 的操作就这样变成了均摊 O(1) 的,当然不会阻塞啦。
Redis 是一个在线服务,其数据结构也是根据这个特性来设计的,把一个大的操作均摊到每个细小的操作中来降低算法复杂度,这种思想并不罕见,比如带懒惰标记的线段树,伸展树,STL 中的 vector 也是均摊的来算复杂度,这种方法虽然有点耍赖皮,但是相当实用啊。
下一讲来讲 Redis 的事件系统吧,这个系统一方面使得 Redis 效率极高,另一方面也降低了很多的编码复杂度,也是一个精妙的设计。

这篇关于Redis 源码分析(二) 一个 rehash 也不阻塞的哈希表的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1095904

相关文章

redis中使用lua脚本的原理与基本使用详解

《redis中使用lua脚本的原理与基本使用详解》在Redis中使用Lua脚本可以实现原子性操作、减少网络开销以及提高执行效率,下面小编就来和大家详细介绍一下在redis中使用lua脚本的原理... 目录Redis 执行 Lua 脚本的原理基本使用方法使用EVAL命令执行 Lua 脚本使用EVALSHA命令

Python中的Walrus运算符分析示例详解

《Python中的Walrus运算符分析示例详解》Python中的Walrus运算符(:=)是Python3.8引入的一个新特性,允许在表达式中同时赋值和返回值,它的核心作用是减少重复计算,提升代码简... 目录1. 在循环中避免重复计算2. 在条件判断中同时赋值变量3. 在列表推导式或字典推导式中简化逻辑

Redis 热 key 和大 key 问题小结

《Redis热key和大key问题小结》:本文主要介绍Redis热key和大key问题小结,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录一、什么是 Redis 热 key?热 key(Hot Key)定义: 热 key 常见表现:热 key 的风险:二、

C#使用StackExchange.Redis实现分布式锁的两种方式介绍

《C#使用StackExchange.Redis实现分布式锁的两种方式介绍》分布式锁在集群的架构中发挥着重要的作用,:本文主要介绍C#使用StackExchange.Redis实现分布式锁的... 目录自定义分布式锁获取锁释放锁自动续期StackExchange.Redis分布式锁获取锁释放锁自动续期分布式

Redis Pipeline(管道) 详解

《RedisPipeline(管道)详解》Pipeline管道是Redis提供的一种批量执行命令的机制,通过将多个命令一次性发送到服务器并统一接收响应,减少网络往返次数(RTT),显著提升执行效率... 目录Redis Pipeline 详解1. Pipeline 的核心概念2. 工作原理与性能提升3. 核

redis过期key的删除策略介绍

《redis过期key的删除策略介绍》:本文主要介绍redis过期key的删除策略,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录第一种策略:被动删除第二种策略:定期删除第三种策略:强制删除关于big key的清理UNLINK命令FLUSHALL/FLUSHDB命

Redis消息队列实现异步秒杀功能

《Redis消息队列实现异步秒杀功能》在高并发场景下,为了提高秒杀业务的性能,可将部分工作交给Redis处理,并通过异步方式执行,Redis提供了多种数据结构来实现消息队列,总结三种,本文详细介绍Re... 目录1 Redis消息队列1.1 List 结构1.2 Pub/Sub 模式1.3 Stream 结

Java程序进程起来了但是不打印日志的原因分析

《Java程序进程起来了但是不打印日志的原因分析》:本文主要介绍Java程序进程起来了但是不打印日志的原因分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java程序进程起来了但是不打印日志的原因1、日志配置问题2、日志文件权限问题3、日志文件路径问题4、程序

SpringBoot中配置Redis连接池的完整指南

《SpringBoot中配置Redis连接池的完整指南》这篇文章主要为大家详细介绍了SpringBoot中配置Redis连接池的完整指南,文中的示例代码讲解详细,具有一定的借鉴价值,感兴趣的小伙伴可以... 目录一、添加依赖二、配置 Redis 连接池三、测试 Redis 操作四、完整示例代码(一)pom.

Java 正则表达式URL 匹配与源码全解析

《Java正则表达式URL匹配与源码全解析》在Web应用开发中,我们经常需要对URL进行格式验证,今天我们结合Java的Pattern和Matcher类,深入理解正则表达式在实际应用中... 目录1.正则表达式分解:2. 添加域名匹配 (2)3. 添加路径和查询参数匹配 (3) 4. 最终优化版本5.设计思