一次Redis TTL 为0的问题排查

2024-05-14 02:18
文章标签 问题 redis 排查 一次 ttl

本文主要是介绍一次Redis TTL 为0的问题排查,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一次Redis TTL 为0的问题排查

 


事情是这样的,今天中午业务突然RTX上找我,说一个新建的Twemproxy集群数据查询的时候出了问题,Redis的TTL返回为0,让我帮忙看一看:

 当时听完就觉得问题很诡异,按照之前的经验来说,Redis的TTL怎么也不可能为0啊,见:http://redis.io/commands/ttl

一次Redis <wbr>TTL <wbr>为0的问题排查

 Redis的key,通过TTL命令返回key的过期时间,一般来说有3中:

1.   当前key没有设置过期时间,所以会返回-1.

2.   当前key有设置过期时间,而且key已经过期,所以会返回-2.

3.   当前key有设置过期时间,且key还没有过期,故会返回key的正常剩余时间.

所以,十分疑惑为何会出现key的TTL为0的情况,当时第一感觉问题会不会出现在Twemproxy里面,于是让复杂源码开发的同事查一下twemproxy中是否有对ttl命令的二次处理,于此同时登录到那台twemproxy上,ttl查看相关key,确认结果确实为0,如下图所示:

一次Redis <wbr>TTL <wbr>为0的问题排查

遇到这种问题,首选怀疑是否是个例,于是自行插入key测试:

一次Redis <wbr>TTL <wbr>为0的问题排查

 

 测试过程如上图所示:

1.   setex a 10 1;设置一个key a,过期时间10s,值为1.

2.   通过TTL命令查看a的剩余过期时间,结果为6s.

3.   等待一会儿,再次TTL查看,key的过期时间竟然为0。

果然不是个别现象。同时源码的同事反馈,twemproxy本身并未对ttl命令做过任何处理,故我们通过内部的find_key工具,获取该key所在的hash环上的real server(一致性hash算法),到所在的redis再确认一下:

一次Redis <wbr>TTL <wbr>为0的问题排查

        看来确实是redis本事的问题,我们开始怀疑是Redis的内部出现的bug,于是在其他版本上进行了测试,返回的结果都是正确的,看来版本bug的可能性很高,但是并不能确定。

   我们又在其他的同版本实例上, 进行了同样的测试,但是却并未发现TTL返回0的情况。看来只能去查看源码了。

   于是我们查看了redis对于ttl这个命令的源代码,代码如下:

一次Redis <wbr>TTL <wbr>为0的问题排查

    代码中确实出现了TTL = 0 的情况,理论上对于存在过期时间的key,应该返回-2才对,而这个代码中,第一个if语句(应该返回-2)并没有执行,才导致调入了第二个循环里,而理论上当前的key的过期时间一定小于当前时间戳(且不为-1),所以TTL应该是小于0,而在代码里,作者将TTL<0的情况处理成TTL=0,那问题就在为什么第一个个if没有生效上了,既该条件的主要判断函数lookupKeyRead并没有返回NULL,再查看该函数的代码:

一次Redis <wbr>TTL <wbr>为0的问题排查

从这开始终于看出点端倪了,该函数之所以没有返回NULL,也是由于第一个if语句并没有return NULL,从代码的评论中可以看出,当redis作为slave的时候,是可能不返回NULL的。

一次Redis <wbr>TTL <wbr>为0的问题排查

从expireIfNeeded函数的注释中可以看到,当当前的Redis为Slave时,为了保证主从数据的一致性,是并不会将当前key删除的,触发这一句:if (server.masterhost != NULL) return now > when;当前的时间now一定是大于key存储的过期时间的,故该函数还是返回了1,这样又回到lookupKeyRead,函数中。下面的这段函数起到决定性作用:

一次Redis <wbr>TTL <wbr>为0的问题排查

以下几个条件满足的时候,该函数才会Return NULL。

1.   当前链接存在

2.   当前链接不是master

3.   当前链接的命令存在

4.   当前链接的命令flags于REDIS_CMD_READONLY的与为True

前三个比较在测试过程中,一定是为True的,问题在第四个条件上,这里又引出了Redis Command的flags,在客户端,通过client list,可以查看到当前链接的flags:

一次Redis <wbr>TTL <wbr>为0的问题排查

可以看到,执行ttl命令的flags为N,而在下面的代码中可以看出flags=N时,表示flags=0,所以在上面的代码中,flags & REDIS_CMD_READONLY = 0 &2(REDIS_CMD_READONLY = 2,redis.h中定义),故这个if语句也没有进入,所以并没有返回NULL,因此导致ttlGenericCommand命令返回了TTL=0的结果。(至于redis使用这些flags的原理以及上面的if语句的原理,还需要更加深入的分析,这里就不再阐述了)

 

所以,这种情况下,我们才知道,如果一个redis作为slave,且将slave-read-only设置为off,并写入了一个带有TTL的key时,当key过期后,该key是不会被Redis删除的,且TTL在过期后永远为0。

带着这样的判断,我们在该redis上执行info命令确认了一下,果然该redis是slave,咨询了相关部署的同事得知,该业务在进行数据迁移过程中,存在多级复制和双写的情况,所以才将redis slave设置为可写状态,此时将slave的slaveof 设置成no one,既断开同步,再次排查所有过期key的TTL都返回-2了。

所以,使用Redis的童鞋们,注意一下,在进行服务迁移等情况所构成多级复制链的时候,在relay上进行过期key的读写处理的时候需要注意TTL带来的问题,若以后遇到TTL返回等于0的时候也可以第一时间确定问题所在了。

这篇关于一次Redis TTL 为0的问题排查的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/987475

相关文章

SpringBoot 异常处理/自定义格式校验的问题实例详解

《SpringBoot异常处理/自定义格式校验的问题实例详解》文章探讨SpringBoot中自定义注解校验问题,区分参数级与类级约束触发的异常类型,建议通过@RestControllerAdvice... 目录1. 问题简要描述2. 异常触发1) 参数级别约束2) 类级别约束3. 异常处理1) 字段级别约束

java内存泄漏排查过程及解决

《java内存泄漏排查过程及解决》公司某服务内存持续增长,疑似内存泄漏,未触发OOM,排查方法包括检查JVM配置、分析GC执行状态、导出堆内存快照并用IDEAProfiler工具定位大对象及代码... 目录内存泄漏内存问题排查1.查看JVM内存配置2.分析gc是否正常执行3.导出 dump 各种工具分析4.

Python错误AttributeError: 'NoneType' object has no attribute问题的彻底解决方法

《Python错误AttributeError:NoneTypeobjecthasnoattribute问题的彻底解决方法》在Python项目开发和调试过程中,经常会碰到这样一个异常信息... 目录问题背景与概述错误解读:AttributeError: 'NoneType' object has no at

Spring的RedisTemplate的json反序列泛型丢失问题解决

《Spring的RedisTemplate的json反序列泛型丢失问题解决》本文主要介绍了SpringRedisTemplate中使用JSON序列化时泛型信息丢失的问题及其提出三种解决方案,可以根据性... 目录背景解决方案方案一方案二方案三总结背景在使用RedisTemplate操作redis时我们针对

Kotlin Map映射转换问题小结

《KotlinMap映射转换问题小结》文章介绍了Kotlin集合转换的多种方法,包括map(一对一转换)、mapIndexed(带索引)、mapNotNull(过滤null)、mapKeys/map... 目录Kotlin 集合转换:map、mapIndexed、mapNotNull、mapKeys、map

nginx中端口无权限的问题解决

《nginx中端口无权限的问题解决》当Nginx日志报错bind()to80failed(13:Permissiondenied)时,这通常是由于权限不足导致Nginx无法绑定到80端口,下面就来... 目录一、问题原因分析二、解决方案1. 以 root 权限运行 Nginx(不推荐)2. 为 Nginx

解决1093 - You can‘t specify target table报错问题及原因分析

《解决1093-Youcan‘tspecifytargettable报错问题及原因分析》MySQL1093错误因UPDATE/DELETE语句的FROM子句直接引用目标表或嵌套子查询导致,... 目录报js错原因分析具体原因解决办法方法一:使用临时表方法二:使用JOIN方法三:使用EXISTS示例总结报错原

Windows环境下解决Matplotlib中文字体显示问题的详细教程

《Windows环境下解决Matplotlib中文字体显示问题的详细教程》本文详细介绍了在Windows下解决Matplotlib中文显示问题的方法,包括安装字体、更新缓存、配置文件设置及编码調整,并... 目录引言问题分析解决方案详解1. 检查系统已安装字体2. 手动添加中文字体(以SimHei为例)步骤

Redis中Stream详解及应用小结

《Redis中Stream详解及应用小结》RedisStreams是Redis5.0引入的新功能,提供了一种类似于传统消息队列的机制,但具有更高的灵活性和可扩展性,本文给大家介绍Redis中Strea... 目录1. Redis Stream 概述2. Redis Stream 的基本操作2.1. XADD

SpringSecurity整合redission序列化问题小结(最新整理)

《SpringSecurity整合redission序列化问题小结(最新整理)》文章详解SpringSecurity整合Redisson时的序列化问题,指出需排除官方Jackson依赖,通过自定义反序... 目录1. 前言2. Redission配置2.1 RedissonProperties2.2 Red