【实战总结】使用Redis做模糊匹配查询

2024-08-30 10:32

本文主要是介绍【实战总结】使用Redis做模糊匹配查询,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近在做一个模糊匹配查询的需求,剖析需求本质无非就是根据入参来模糊匹配相关数据进行返回展示。

由于数据是存储在数据库的,简单实现的话可以考虑使用DB的SQL来进行模糊匹配查询,比较考量的就是如何控制你的SQL以及如果能够高效命中索引来优化SQL来实现快速查询了。

由于是全查询的业务,而且业务场景对服务响应是有一定要求的,如果简单的使用数据库恐怕后续峰值难以抗住且也会影响其他同库的读写操作,所以这次打算还是使用缓存来解决这种全查询场景。

Redis的性能非常棒,而且支持多种数据结构供开发者存储和调用,而且提供了大量API对开发非常友好,而且这些API的内部算法也是非常考究的,真的是开发利器。

1、需求背景

按照汉字以最左匹配原则进行模糊匹配,每次返回不超过固定数量的匹配词即可。

2、设计分析

首先要分析设计要解决哪些问题:

Q:高并发场景下,如何保证服务可靠且快速响应

A:使用Redis做全查询缓存,DB做数据持久化,所有请求打到缓存,保护DB;若缓存失效,把请求拦截直接返回,发送MQ异步请求DB数据更新缓存;若缓存异常,代码做兜底控制,如果可以置入动态配置来控制是否兜底查DB,极端情况下直接服务降级处理不走DB。

Q:使用Redis哪种数据结构进行存储数据?

A:首先要考虑需要返回哪些数据,且这些数据的查询可以支持模糊查询;由于需求只需要返回名称和对应ID,决定采用Hash表进行存储;且hash表支持模糊查询命令。

3、数据存储

关于Redis的命令可以参考http://doc.redisfans.com/index.html

在应用启动时,使用hmset进行批量全量缓存数据更新,这里有个细节点,由于是分布式部署,如果不加限制默认每台机器启动都会更新一遍,其实是没有必要的,可以做一个全局分布式锁进行判断和控制,这个不难实现不再细说。

HMSET key field value [field value ...]

要模糊查什么就把模糊查的作为field就可以了,由于我这里只需要两个字段,我就借用哈希表的数据结构进行存储了,如果需要更多字段可以研究使用有序集合或者其他数据结构。

4、数据模糊查询

使用hscan进行模糊查询,可以使用,优缺点分析参考http://doc.redisfans.com/key/scan.html#scan

HSCAN key cursor [MATCH pattern] [COUNT count]

由于hscan使用了游标,是一个增量式命令,每次查询都是返回一部分数据,所以不会像keys类命令hang住Redis导致服务短暂停滞,所以它是安全无公害的,只要运用得当,在生产环境是可以放心使用的,关于缺点要参考:

  • 同一个元素可能会被返回多次。 处理重复元素的工作交由应用程序负责, 比如说, 可以考虑将迭代返回的元素仅仅用于可以安全地重复执行多次的操作上。
  • 如果一个元素是在迭代过程中被添加到数据集的, 又或者是在迭代过程中从数据集中被删除的, 那么这个元素可能会被返回, 也可能不会, 这是未定义的(undefined)。

在使用过程中仔细研究这个命令的底层实现,根据实际业务场景去使用。

业务底层还是需要封装下hscan命令,由于是游标查询,最开始cursor我们都设置为0就好,每次从0开始查询,count来控制每次遍历的数量,由于这个命令执行的时间复杂度是O(N),所以count越大,每次执行时间理论上会越长,可以根据实际场景进行调整,在遍历时候判断返回的游标cursor是否为0,如果为0代表整个遍历结束。

目前只使用到最左匹配模糊查询,如上图,我试了下最右匹配、中间模糊也是可以查询到的,可以支持后续其他业务诉求。

5、特殊字符处理

由于一般我们检索的名称是汉字,存储到Redis可能会有环境问题导致乱码,我目前的处理是把汉字转ASCII码进行存储,同样查询的时候也是转ASCII码进行查询,这样可以解决汉字或者编码带来的乱码问题。

这篇关于【实战总结】使用Redis做模糊匹配查询的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1120567

相关文章

Android Paging 分页加载库使用实践

《AndroidPaging分页加载库使用实践》AndroidPaging库是Jetpack组件的一部分,它提供了一套完整的解决方案来处理大型数据集的分页加载,本文将深入探讨Paging库... 目录前言一、Paging 库概述二、Paging 3 核心组件1. PagingSource2. Pager3.

java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)

《java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)》:本文主要介绍java中pdf模版填充表单踩坑的相关资料,OpenPDF、iText、PDFBox是三... 目录准备Pdf模版方法1:itextpdf7填充表单(1)加入依赖(2)代码(3)遇到的问题方法2:pd

python使用try函数详解

《python使用try函数详解》Pythontry语句用于异常处理,支持捕获特定/多种异常、else/final子句确保资源释放,结合with语句自动清理,可自定义异常及嵌套结构,灵活应对错误场景... 目录try 函数的基本语法捕获特定异常捕获多个异常使用 else 子句使用 finally 子句捕获所

解密SQL查询语句执行的过程

《解密SQL查询语句执行的过程》文章讲解了SQL语句的执行流程,涵盖解析、优化、执行三个核心阶段,并介绍执行计划查看方法EXPLAIN,同时提出性能优化技巧如合理使用索引、避免SELECT*、JOIN... 目录1. SQL语句的基本结构2. SQL语句的执行过程3. SQL语句的执行计划4. 常见的性能优

C++11右值引用与Lambda表达式的使用

《C++11右值引用与Lambda表达式的使用》C++11引入右值引用,实现移动语义提升性能,支持资源转移与完美转发;同时引入Lambda表达式,简化匿名函数定义,通过捕获列表和参数列表灵活处理变量... 目录C++11新特性右值引用和移动语义左值 / 右值常见的左值和右值移动语义移动构造函数移动复制运算符

Python对接支付宝支付之使用AliPay实现的详细操作指南

《Python对接支付宝支付之使用AliPay实现的详细操作指南》支付宝没有提供PythonSDK,但是强大的github就有提供python-alipay-sdk,封装里很多复杂操作,使用这个我们就... 目录一、引言二、准备工作2.1 支付宝开放平台入驻与应用创建2.2 密钥生成与配置2.3 安装ali

C#中lock关键字的使用小结

《C#中lock关键字的使用小结》在C#中,lock关键字用于确保当一个线程位于给定实例的代码块中时,其他线程无法访问同一实例的该代码块,下面就来介绍一下lock关键字的使用... 目录使用方式工作原理注意事项示例代码为什么不能lock值类型在C#中,lock关键字用于确保当一个线程位于给定实例的代码块中时

MySQL 强制使用特定索引的操作

《MySQL强制使用特定索引的操作》MySQL可通过FORCEINDEX、USEINDEX等语法强制查询使用特定索引,但优化器可能不采纳,需结合EXPLAIN分析执行计划,避免性能下降,注意版本差异... 目录1. 使用FORCE INDEX语法2. 使用USE INDEX语法3. 使用IGNORE IND

C# $字符串插值的使用

《C#$字符串插值的使用》本文介绍了C#中的字符串插值功能,详细介绍了使用$符号的实现方式,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习吧... 目录$ 字符使用方式创建内插字符串包含不同的数据类型控制内插表达式的格式控制内插表达式的对齐方式内插表达式中使用转义序列内插表达式中使用

flask库中sessions.py的使用小结

《flask库中sessions.py的使用小结》在Flask中Session是一种用于在不同请求之间存储用户数据的机制,Session默认是基于客户端Cookie的,但数据会经过加密签名,防止篡改,... 目录1. Flask Session 的基本使用(1) 启用 Session(2) 存储和读取 Se