redis数据结构之String详解

2025-08-15 09:50

本文主要是介绍redis数据结构之String详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《redis数据结构之String详解》Redis以String为基础类型,因C字符串效率低、非二进制安全等问题,采用SDS动态字符串实现高效存储,通过RedisObject封装,支持多种编码方式(如...

一、为什么Redis选String作为基础类型?

redis中的所有key是字符串,所有value本质上也是字符串,比如 集合set中的每一个 成员 都是一个独立的字符串对象,列表中的每一个 元素 都是一个独立的字符串对象,整个HASH是一个对象,它内部的每一个 字段(field) 和一个字段值(value) 都是一个独立的字符串对象

redis是通过C语言来实现的,但是没有直接使用c语言中的字符串,有几下几点原因

  • 获取字符串长度需要通过运算:C字符串以\0(空字符)结尾,要获取长度必须遍历整个数组直到遇到\0,时间复杂度为O(n)MDnMlJy,这在高性能数据库如Redis中效率低下。
  • 非二进制安全:C字符串不能存储任意二进制数据,因为它依赖于\0作为结束符。如果数据中包含\0(如一些二进制文件),会被错误截断,破坏数据完整性。
  • 不可修改:C语言字符串常量(如char* s = "hello")是只读的,无法直接扩展或修改其长度,这在动态数据存储中不灵活。

Redis的解决方案:Redis因此构建了自己的字符串结构——SDS(简单动态字符串),它通过设计一个智能结构来支持查找、二进制安全性和动态修改。

二、SDS底层数据结构

redis数据结构之String详解

uint8_t (8位无符号整数),可表示的最大值是 255 (因为 2^8 - 1 = 255),因此 len 最多记录 255 字节 的长度,否则会溢出,如果一个 SDS 字符串的实际长度超过 255 字节,Redis 会自动选择更大容量的结构体(如 sdshdr16/sdshdr32)。

三、RedisObject是什么

通常我们了解的数据结构有字符串、双端链表、字android典、压缩列表、整数集合等,但是Redis为了加快读写速度,php并没有直接使用这些数据结构,而是在此基础上又包装了一层称之为RedisObject。

RedisObject 有五种对象:字符串对象(String)、列表对象(List)、哈希对象(Hash)、集合对象(Set)和有序集合对象(ZSet)。

redis数据结构之String详解

1.type:数据类型标识(4 bit)就是redis基本类型

类型常量www.chinasem.cn应数据结构
OBJ_STRING0字符串
OBJ_LIST1列表
OBJ_SET2集合
OBJ_ZSET3有序集合
OBJ_HASH4哈希表

2.encoding:内部编码(4 bit)

同一数据类型可对应不同底层实现:

编码常量适用类型底层结构
OBJ_ENCODING_INT0String整数存储
OBJ_ENCODING_EMBSTR1String短字符串优化
OBJ_ENCODING_RAW2StringSDS动态字符串
OBJ_ENCODING_HT3Hash/Set哈希表
OBJ_ENCODING_ZIPLIST4LiMDnMlJyst/Hash/Zset压缩列表
OBJ_ENCODING_QUICKLIST5List快速列表
OBJ_ENCODING_SKIPLIST6Zset跳表
OBJ_ENCODING_STREAM7Stream流数据结构

动态编码转换示例:

  • 当 Hash 的元素超过 hash-max-ziplist-entries 时
  • OBJ_ENCODING_ZIPLIST → OBJ_ENCODING_HT

3.lru:缓存淘汰信息(24 bit)

  • LRU模式:记录对象最后访问时间戳(精度:秒级)
  • LFU模式(Redis 4.0+):
16 bits      8 bits
+------------+------+
| 访问时间戳   | 频率 |
+------------+------+
  • 频率(logc):基于概率递增的访问计数器
  • 时间戳:解决冷数据滞留问题

4.refcount:引用计数(4字节)

  • 内存回收refcount=0 时自动释放内存
  • 对象共享:相同数据复用对象(如 SET key 100 共享整数对象)
  • 客户端引用:同一 key 被多个客户端连接引用

5.ptr:数据指针(8字节)

指向实际数据结构,如:

  • OBJ_ENCODING_INT → 直接存储整数(void * 强转为 long
  • OBJ_ENCODING_RAW → 指向 sds 结构
  • OBJ_ENCODING_HT → 指向 dict 哈希表

四、String类型数据结构

string类型在redis中有三种编码方式

RAW编码

分配两次内存 RedisObject和SDS的内存不连续 两个数据结构申请了两片内存区域

redis数据结构之String详解

EMBSTR编码

redis数据结构之String详解

INT编码

redis数据结构之String详解

为什么分界线是44字节?

44字节的临界值源于内存分配器的优化策略,具体计算如下:

1. 内存分配器的最小单位

  • Redis 默认使用 jemalloc 或 glibc malloc
  • 这些分配器的最小分配单元通常是 64字节(CPU缓存行对齐)

2. EMBSTR 的总内存占用公式

总大小 = RedisObject(16字节) + SDS头部(3字节) + 字符串内容(N字节) + 结束符\0(1字节)
  • 最大允许占用:64字节(分配器最小单元)
  • 固定开销:16(robj) + 3(sds) + 1(\0) = 20字节
  • 可用空间:64 - 20 = 44字节
编码类型OBJ_ENCODING_INTOBJ_ENCODING_EMBSTROBJ_ENCODING_RAW
触发条件数值类型且值在 [LONG_MIN, LONG_MAX]字符串长度 ≤ 44字节字符串长度 > 44字节
内存分配次数1次(RedisObject内联存储)1次(连续内存块)2次(RedisObject + SDS分开)
适用场景计数器(如 INCR 操作)短字符串(如jsON片段、短URL)长文本、二进制数据
修改时的行为直接替换整数值自动转换为 RAW 编码原地修改或重新分配
内存占用示例存储 100:16字节(RedisObject)存储 "hello":16+6=22字节存储1KB文本:16+1024+9=1049字节

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持China编程(www.chinasem.cn)。

这篇关于redis数据结构之String详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1155747

相关文章

C++ move 的作用详解及陷阱最佳实践

《C++move的作用详解及陷阱最佳实践》文章详细介绍了C++中的`std::move`函数的作用,包括为什么需要它、它的本质、典型使用场景、以及一些常见陷阱和最佳实践,感兴趣的朋友跟随小编一起看... 目录C++ move 的作用详解一、一句话总结二、为什么需要 move?C++98/03 的痛点⚡C++

MySQL中between and的基本用法、范围查询示例详解

《MySQL中betweenand的基本用法、范围查询示例详解》BETWEENAND操作符在MySQL中用于选择在两个值之间的数据,包括边界值,它支持数值和日期类型,示例展示了如何使用BETWEEN... 目录一、between and语法二、使用示例2.1、betwphpeen and数值查询2.2、be

python中的flask_sqlalchemy的使用及示例详解

《python中的flask_sqlalchemy的使用及示例详解》文章主要介绍了在使用SQLAlchemy创建模型实例时,通过元类动态创建实例的方式,并说明了如何在实例化时执行__init__方法,... 目录@orm.reconstructorSQLAlchemy的回滚关联其他模型数据库基本操作将数据添

Java中ArrayList与顺序表示例详解

《Java中ArrayList与顺序表示例详解》顺序表是在计算机内存中以数组的形式保存的线性表,是指用一组地址连续的存储单元依次存储数据元素的线性结构,:本文主要介绍Java中ArrayList与... 目录前言一、Java集合框架核心接口与分类ArrayList二、顺序表数据结构中的顺序表三、常用代码手动

JAVA线程的周期及调度机制详解

《JAVA线程的周期及调度机制详解》Java线程的生命周期包括NEW、RUNNABLE、BLOCKED、WAITING、TIMED_WAITING和TERMINATED,线程调度依赖操作系统,采用抢占... 目录Java线程的生命周期线程状态转换示例代码JAVA线程调度机制优先级设置示例注意事项JAVA线程

详解C++ 存储二进制数据容器的几种方法

《详解C++存储二进制数据容器的几种方法》本文主要介绍了详解C++存储二进制数据容器,包括std::vector、std::array、std::string、std::bitset和std::ve... 目录1.std::vector<uint8_t>(最常用)特点:适用场景:示例:2.std::arra

C++构造函数中explicit详解

《C++构造函数中explicit详解》explicit关键字用于修饰单参数构造函数或可以看作单参数的构造函数,阻止编译器进行隐式类型转换或拷贝初始化,本文就来介绍explicit的使用,感兴趣的可以... 目录1. 什么是explicit2. 隐式转换的问题3.explicit的使用示例基本用法多参数构造

Android使用java实现网络连通性检查详解

《Android使用java实现网络连通性检查详解》这篇文章主要为大家详细介绍了Android使用java实现网络连通性检查的相关知识,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录NetCheck.Java(可直接拷贝)使用示例(Activity/Fragment 内)权限要求

MyBatis中的两种参数传递类型详解(示例代码)

《MyBatis中的两种参数传递类型详解(示例代码)》文章介绍了MyBatis中传递多个参数的两种方式,使用Map和使用@Param注解或封装POJO,Map方式适用于动态、不固定的参数,但可读性和安... 目录✅ android方式一:使用Map<String, Object>✅ 方式二:使用@Param

JAVA transient 关键字作用详解

《JAVAtransient关键字作用详解》Java的transient关键字用于修饰成员变量,使其不参与序列化过程,通过自定义序列化方法,可以手动控制transient变量的序列化行为,本文给大... 目录一、transient关键字作用二、原理详解三、典型使用场景四、代码示例五、注意事项六、与 stat