Docker:安装RediSearch全文搜索

2024-06-22 11:04

本文主要是介绍Docker:安装RediSearch全文搜索,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1、简述

在本文中,我们将介绍如何使用Docker快速、简便地安装RediSearch,Redis的全文搜索模块。RediSearch提供了高效的全文搜索功能,通过Docker安装,可以轻松地在任何环境中部署和管理RediSearch。在这里插入图片描述
官网地址:https://github.com/RediSearch/RediSearch.git

2、性能

RediSearch是Redis的一个模块,用于实现全文搜索功能。它建立在Redis之上,利用其高性能和灵活性,为用户提供了快速、实时的搜索能力。RediSearch支持各种搜索功能,包括全文搜索、模糊搜索、排序、过滤等,适用于各种场景,如搜索引擎、内容管理系统、电子商务平台等。

  • 索引构建
    在索引构建测试中,RediSearch 用221秒的速度超过了 Elasticsearch的349秒,领先58%。
    在这里插入图片描述
  • 查询性能
    数据集建立索引后,我们使用运行在专用负载生成器服务器上的 32 个客户端启动了两个词的搜索查询。如下图所示,RediSearch 的吞吐量达到了 12.5K ops/sec,而 Elasticsearch 的吞吐量达到了 3.1K ops/sec,快了 4 倍。此外,RediSearch 的延迟稍好一些,平均为 8 毫秒,而 Elasticsearch 为 10 毫秒。
    在这里插入图片描述
    由此可见,RediSearch 在性能上对比 Elasticsearch 有比较大的优势。

3、安装

首先,确保您已经安装了Docker。然后,我们将通过Docker Hub上的官方RediSearch镜像来安装RediSearch。

打开终端或命令行界面,在其中运行以下命令来拉取RediSearch镜像:

docker pull redislabs/redisearch:latest

运行以下命令启动RediSearch容器:

docker run --name redis-search --restart=always -p 6379:6379 -d redislabs/redisearch:latest 

或者

docker run -d --name redis-stack-server --restart=always -p 6379:6379 redis/redis-stack-server:latest

这条命令会从Docker Hub拉取最新版本的RediSearch镜像并在名为redis-search的容器中运行它。参数-p 6379:6379将容器内的6379端口映射到主机的6379端口上。

通过docker exec指令确认当前RediSearch安装是否成功:

[root@localhost ~]# docker exec -it redis-search /bin/bash
root@fb0aa7b3b11b:/data# redis-cli
127.0.0.1:6379> module list
1) 1) "name"2) "search" # 查看是否包含search模块3) "ver"4) (integer) 20015

4、指令

RediSearch模块提供了一系列用于操作全文搜索索引的指令,以下是这些指令的详细解释及示例:

  • FT.CREATE:创建一个新的全文搜索索引。
FT.CREATE index_name SCHEMA field1 type [field2 type ...]

示例:

FT.CREATE idx:goods on hash prefix 1 "goods:" language chinese schema goodsName text sortableFT.CREATE 创建索引命令
idx:goods 索引名称
on hash 索引数据基于hash类型源数据构建
prefix 1 "goods:" 表示要创建索引的源数据前缀匹配规则
language chinese 表示支持中文语言分词
schema 表示字段定义,goodsName元数据属性名 text字段类型 sortable自持排序
  • FT.ADD:向索引中添加一个新文档。
FT.ADD index_name document_id score [NOSAVE] [REPLACE] [LANGUAGE lang] [PAYLOAD payload]FIELDS field1 value1 [field2 value2 ...]

示例:

FT.ADD idx:goods doc1 1.0 FIELDS title "RedisSearch Introduction" body "RedisSearch is a full-text search engine built on top of Redis"docId: 这里说是id并不代表只能说数字,可以是字符串。作为document的唯一标识。
score: 评分,类似于zset里的score,范围从0~1,如果不知道打多少可以默认打1。
NOSAVE:如果开启该选项我们不会在索引时保存真正的document。
REPLACE:更新或者插入,删除原本的document
PARTIAL (only applicable with REPLACE):在replace的时候指定对应的列
FIELDS: 字段对应create index时的schema
PAYLOAD {payload}: 在查询的时候使用,还不是太理解。。。
IF {condition}: 配合replace使用,对判断语句进行判断后决定是否生效replace e.g. FT.ADD idx doc 1 REPLACE IF "@timestamp < 23323234234".
LANGUAGE language: 指定语言,可以是中文:chinese
  • FT.SEARCH:在索引中执行全文搜索。
FT.SEARCH index_name query [NOCONTENT] [VERBATIM] [NOSTOPWORDS] [WITHSCORES] [WITHSORTKEYS] [FILTER field value [field value ...]][GEOFILTER field lon lat radius m|km|mi|ft] [INKEYS num_keys key [key ...]] [INFIELDS num_fields field [field ...]][RETURN num_docs [ASC|DESC]] [SUMMARIZE [FIELDS num_fields field [field ...]] LEN len FRAGS frags][HIGHLIGHT [FIELDS num_fields field [field ...]] [TAGS open close] [FRAGS frags] [LEN len] [SEPARATOR sep] [MAXLEN len] [ELIPSIS ellipsis]][SLOP slop] [INORDER] [LANGUAGE lang] [EXPANDER expander] [SCORER scorer] [PAYLOAD]

示例:

FT.SEARCH idx:goods "RedisSearch"
  • FT.AGGREGATE:在索引中执行聚合操作。
FT.AGGREGATE index_name query [LOAD [NUM num] [TERMS term [..]] [PROPERTIES prop [..]] [GROUPBY field [..]] [REDUCE reduce_function | REDUCER reduce_function]] [APPLY function [..]] [FILTER filter [..]] [SORTBY field [asc|desc] | MAX num [BY field [asc|desc]] [MAXTERMS num] [WITHCURSOR] [WITHFILTER] [WITHSORTKEYS]

示例:

FT.AGGREGATE idx:goods "*" GROUPBY 1 @title REDUCE COUNT 0 AS num_docs
  • FT.INFO:获取索引的信息。
FT.INFO index_name

示例:

FT.INFO idx:goods 
  • FT.DROPINDEX:删除指定的索引。
FT.DROPINDEX index_name [DD]

示例:

FT.DROPINDEX idx:goods 

以上是RediSearch模块中常用的指令及其详细解释和示例。通过这些指令,您可以在Redis中轻松构建和管理全文搜索索引,并执行各种搜索和聚合操作。

5、应用

接下来,我们将展示如何使用Java来连接到RediSearch并进行查询。我们将使用Jedis作为Redis的Java客户端库,确保您已经将其添加到项目依赖中:

<parent><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-parent</artifactId><version>3.2.5</version><relativePath/> <!-- lookup parent from repository -->
</parent>
//jedis 4.0以上版本就默认支持RediSearch
<dependency><groupId>redis.clients</groupId><artifactId>jedis</artifactId><version>5.1.0</version>
</dependency>

以下是一个简单的Java类,演示了如何连接到RediSearch并执行一个简单的全文搜索查询:

package com.example.lkfy.example;import org.apache.commons.lang.StringUtils;
import org.apache.commons.pool2.impl.GenericObjectPoolConfig;
import org.springframework.beans.factory.annotation.Autowired;
import redis.clients.jedis.*;
import redis.clients.jedis.search.*;import java.time.Duration;
import java.util.HashMap;
import java.util.Map;
import java.util.Set;public class RedisSearchExample {public static final String GOODS_IDX_PREFIX = "idx:goods:";@Autowiredprivate UnifiedJedis client;public RedisSearchExample() {GenericObjectPoolConfig jedisPoolConfig = new JedisPoolConfig();jedisPoolConfig.setMaxIdle(10);jedisPoolConfig.setMaxWaitMillis(3000);jedisPoolConfig.setJmxEnabled(false);client = new JedisPooled(jedisPoolConfig, "192.168.157.128", 6379, 1000, "123456",0);}/*** 新增索引数据*/private void hset(String keyPrefix, Map<String, String> hash) {// 支持中文hash.put("_language", "chinese");client.hset(keyPrefix, hash);}/*** 查询索引列表*/public Set<String> listIndex() {return client.ftList();}/*** 创建索引** @param idxName 索引名称* @param prefix  要索引的数据前缀* @param schema  索引字段配置*/public void createIndex(String idxName, String prefix, Schema schema) {IndexDefinition rule = new IndexDefinition(IndexDefinition.Type.HASH).setPrefixes(prefix).setLanguage("chinese");client.ftCreate(idxName,IndexOptions.defaultOptions().setDefinition(rule),schema);}/*** 查询** @param idxName 索引名称* @param search  查询key* @param sort    排序字段* @return searchResult*/public SearchResult query(String idxName, String search, String sort) {Query q = new Query(search);if (StringUtils.isNotBlank(sort)) {q.setSortBy(sort, false);}q.setLanguage("chinese");q.limit(0, 10);return client.ftSearch(idxName, q);}public static void main(String[] args) {RedisSearchExample example = new RedisSearchExample();String id ="1";Map<String, String> hash = new HashMap<>();hash.put("id",id);hash.put("goodsName","你好hello");example.hset("idx:goods" , hash );SearchResult searchResult = example.query("idx:goods","*", null);System.out.println(searchResult.toString());}}

6、优点和场景

RediSearch是Redis的全文搜索模块,具有以下优点和适用场景:

6.1 优点
  • 快速高效: RediSearch基于倒排索引实现,具有高效的全文搜索能力,能够快速地处理大量文本数据。
  • 与Redis集成: RediSearch是作为Redis模块而不是单独的软件包提供的,因此可以与现有的Redis部署集成,无需额外的基础设施或管理开销。
  • 分布式支持: RediSearch支持分布式部署,可以水平扩展以处理大量的搜索请求。
  • 丰富的搜索功能: 提供了丰富的搜索功能,包括全文搜索、模糊搜索、排序、过滤等,能够满足各种搜索需求。
  • 实时索引更新: 支持实时索引更新,可以在数据变更时立即更新索引,保持搜索结果的实时性。
  • 轻量级: RediSearch是一个轻量级的模块,易于安装、部署和管理。
6.2 应用场景:
  • 实时搜索引擎: 适用于构建实时搜索引擎,能够快速地处理用户的搜索请求,并返回相关的搜索结果。
  • 内容管理系统: 可以用于构建内容管理系统,支持对大量文本数据进行全文搜索、过滤和排序。
  • 电子商务平台: 用于构建电子商务平台的搜索功能,支持商品搜索、过滤和排序,提供更好的用户搜索体验。
  • 社交网络: 适用于构建社交网络平台,支持用户搜索、内容搜索等功能。
  • 日志分析: 可以用于实时分析和搜索日志数据,支持日志检索、过滤和分析。
  • 实时推荐系统: 用于构建实时推荐系统,支持对用户喜好进行实时搜索和推荐。

总的来说,RediSearch具有高效、快速、易于集成和扩展的特点,适用于各种需要全文搜索功能的应用场景。

7、总结

通过本文,您学习了如何使用Docker快速、简便地安装RediSearch。RediSearch是Redis的全文搜索模块,提供了高效、实时的全文搜索功能,适用于各种场景。使用Docker安装RediSearch可以轻松地在任何环境中部署和管理RediSearch,为您的应用程序提供强大的全文搜索能力。希望本文对您有所帮助!

这篇关于Docker:安装RediSearch全文搜索的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1084111

相关文章

通过Docker容器部署Python环境的全流程

《通过Docker容器部署Python环境的全流程》在现代化开发流程中,Docker因其轻量化、环境隔离和跨平台一致性的特性,已成为部署Python应用的标准工具,本文将详细演示如何通过Docker容... 目录引言一、docker与python的协同优势二、核心步骤详解三、进阶配置技巧四、生产环境最佳实践

使用docker搭建嵌入式Linux开发环境

《使用docker搭建嵌入式Linux开发环境》本文主要介绍了使用docker搭建嵌入式Linux开发环境,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录1、前言2、安装docker3、编写容器管理脚本4、创建容器1、前言在日常开发全志、rk等不同

RabbitMQ 延时队列插件安装与使用示例详解(基于 Delayed Message Plugin)

《RabbitMQ延时队列插件安装与使用示例详解(基于DelayedMessagePlugin)》本文详解RabbitMQ通过安装rabbitmq_delayed_message_exchan... 目录 一、什么是 RabbitMQ 延时队列? 二、安装前准备✅ RabbitMQ 环境要求 三、安装延时队

linux系统上安装JDK8全过程

《linux系统上安装JDK8全过程》文章介绍安装JDK的必要性及Linux下JDK8的安装步骤,包括卸载旧版本、下载解压、配置环境变量等,强调开发需JDK,运行可选JRE,现JDK已集成JRE... 目录为什么要安装jdk?1.查看linux系统是否有自带的jdk:2.下载jdk压缩包2.解压3.配置环境

Python库 Django 的简介、安装、用法入门教程

《Python库Django的简介、安装、用法入门教程》Django是Python最流行的Web框架之一,它帮助开发者快速、高效地构建功能强大的Web应用程序,接下来我们将从简介、安装到用法详解,... 目录一、Django 简介 二、Django 的安装教程 1. 创建虚拟环境2. 安装Django三、创

linux安装、更新、卸载anaconda实践

《linux安装、更新、卸载anaconda实践》Anaconda是基于conda的科学计算环境,集成1400+包及依赖,安装需下载脚本、接受协议、设置路径、配置环境变量,更新与卸载通过conda命令... 目录随意找一个目录下载安装脚本检查许可证协议,ENTER就可以安装完毕之后激活anaconda安装更

Jenkins的安装与简单配置过程

《Jenkins的安装与简单配置过程》本文简述Jenkins在CentOS7.3上安装流程,包括Java环境配置、RPM包安装、修改JENKINS_HOME路径及权限、启动服务、插件安装与系统管理设置... 目录www.chinasem.cnJenkins安装访问并配置JenkinsJenkins配置邮件通知

Win10安装Maven与环境变量配置过程

《Win10安装Maven与环境变量配置过程》本文介绍Maven的安装与配置方法,涵盖下载、环境变量设置、本地仓库及镜像配置,指导如何在IDEA中正确配置Maven,适用于Java及其他语言项目的构建... 目录Maven 是什么?一、下载二、安装三、配置环境四、验证测试五、配置本地仓库六、配置国内镜像地址

Python安装Pandas库的两种方法

《Python安装Pandas库的两种方法》本文介绍了三种安装PythonPandas库的方法,通过cmd命令行安装并解决版本冲突,手动下载whl文件安装,更换国内镜像源加速下载,最后建议用pipli... 目录方法一:cmd命令行执行pip install pandas方法二:找到pandas下载库,然后

使用IDEA部署Docker应用指南分享

《使用IDEA部署Docker应用指南分享》本文介绍了使用IDEA部署Docker应用的四步流程:创建Dockerfile、配置IDEADocker连接、设置运行调试环境、构建运行镜像,并强调需准备本... 目录一、创建 dockerfile 配置文件二、配置 IDEA 的 Docker 连接三、配置 Do