创新实训(45)——使用ElasticSearch的Suggest实现搜索提示的学习

本文主要是介绍创新实训(45)——使用ElasticSearch的Suggest实现搜索提示的学习,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

昨天实现了句子的搜索,并且简单的更换了分词器,优化一下查询的结果,今天准备学习一下搜索提示的实现,并且设计一下如何使用java api实现搜索提示。

Suggest的学习

在查看官方文档之后,发现ElasticSearch的Suggest总共有四种类型

文档链接:http://doc.codingdict.com/elasticsearch/123/

  • Term Suggester
  • Phrase Suggester
  • Completion Suggester
  • Context Suggester
    然后我就一一了解了一下
    (1)Term suggester
    term 词项建议器,对给入的文本进行分词,为每个词进行模糊查询提供词项建议。对于在索引中存在词默认不提供建议词,不存在的词则根据模糊查询结果进行排序后取一定数量的建议词。
    常用的建议选项:
    在这里插入图片描述
    (2)phrase suggester
    phrase 短语建议,在term的基础上,会考量多个term之间的关系,比如是否同时出现在索引的原文里,相邻程度,以及词频等
    (3)Completion Suggester
    针对自动补全场景而设计的建议器。此场景下用户每输入一个字符的时候,就需要即时发送一次查询请求到后端查找匹配项,在用户输入速度较高的情况下对后端响应速度要求比较苛刻。因此实现上它和其他Suggester采用了不同的数据结构,索引并非通过倒排来完成,而是将analyze过的数据编码成FST和索引一起存放。对于一个open状态的索引,FST会被ES整个装载到内存里的,进行前缀查找速度极快。但是FST只能用于前缀查找,这也是Completion Suggester的局限所在。
    这个是我准备重点使用的Suggester
    注意:使用这个需要在被搜索的字段中设置type为completion,analyzer按情况设置分析器。才能实现自动的补全
    (4)Context Suggester
    好像能通过设置字段,实现上下文的映射。 有两种类型: category 和 geo 。 上下文映射在字段映射中的 contexts 参数下配置。看了半天文档没看明白,好像是能实现:设置地理位置的上下文然后进行地理映射
    具体文档http://doc.codingdict.com/elasticsearch/124/

设计

通过简单的了解,感觉使用ES实现搜索框的补全/纠错功能应该以如下的方式设计:
(1)在用户刚开始输入的过程中,使用Completion Suggester进行关键词前缀匹配,刚开始匹配项会比较多,随着用户输入字符增多,匹配项越来越少。如果用户输入比较精准,可能Completion Suggester的结果已经够好,用户已经可以看到理想的备选项了。
(2)如果Completion Suggester已经到了零匹配,那么可以猜测是否用户有输入错误,这时候可以尝试一下Phrase Suggester。
(3)如果Phrase Suggester没有找到任何option,开始尝试term Suggester。
最后一个Context Suggester,还是不知道该怎么用。。。。。

Completion Suggester的尝试

了解到如果使用 Completion Suggester的话,需要在建立索引的时候,设置field重的suggest的type和analyzer,所以打算找一个demo先学习一下。

参考链接:https://zq99299.github.io/note-book/elasticsearch-senior/es-high/76-completion-suggest.html#什么是-completion-suggest-?

(1)新建索引

PUT /news_website
{"mappings": {"news" : {"properties" : {"title" : {"type": "text","analyzer": "ik_max_word","fields": {"suggest" : {"type" : "completion","analyzer": "ik_max_word"}}},"content": {"type": "text","analyzer": "ik_max_word"}}}}
}

在这里插入图片描述
发现关键的配置是:
在这里插入图片描述
有了这个才能实现自动补全
(2)插入测试数据

PUT /news_website/news/1
{"title": "大话西游电影","content": "大话西游的电影时隔20年即将在2017年4月重映"
}
PUT /news_website/news/2
{"title": "大话西游小说","content": "某知名网络小说作家已经完成了大话西游同名小说的出版"
}
PUT /news_website/news/3
{"title": "大话西游手游","content": "网易游戏近日出品了大话西游经典IP的手游,正在火爆内测中"
}

在这里插入图片描述
(3)尝试进行搜索

GET /news_website/news/_search
{"suggest": {"my-suggest" : {"prefix" : "大话西游","completion" : {"field" : "title.suggest"}}}
}

在这里插入图片描述
注意到结果自动匹配到了三条数据
并且发现搜索的field也有讲究:
在这里插入图片描述

总结

在学习了Suggester之后,我发现自己需要重新按Completion Suggester的要求建立索引,最终才能实现搜索提示。

这篇关于创新实训(45)——使用ElasticSearch的Suggest实现搜索提示的学习的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/685445

相关文章

使用Java将实体类转换为JSON并输出到控制台的完整过程

《使用Java将实体类转换为JSON并输出到控制台的完整过程》在软件开发的过程中,Java是一种广泛使用的编程语言,而在众多应用中,数据的传输和存储经常需要使用JSON格式,用Java将实体类转换为J... 在软件开发的过程中,Java是一种广泛使用的编程语言,而在众多应用中,数据的传输和存储经常需要使用j

Java实现视频格式转换的完整指南

《Java实现视频格式转换的完整指南》在Java中实现视频格式的转换,通常需要借助第三方工具或库,因为视频的编解码操作复杂且性能需求较高,以下是实现视频格式转换的常用方法和步骤,需要的朋友可以参考下... 目录核心思路方法一:通过调用 FFmpeg 命令步骤示例代码说明优点方法二:使用 Jaffree(FF

基于C#实现MQTT通信实战

《基于C#实现MQTT通信实战》MQTT消息队列遥测传输,在物联网领域应用的很广泛,它是基于Publish/Subscribe模式,具有简单易用,支持QoS,传输效率高的特点,下面我们就来看看C#实现... 目录1、连接主机2、订阅消息3、发布消息MQTT(Message Queueing Telemetr

Java实现图片淡入淡出效果

《Java实现图片淡入淡出效果》在现代图形用户界面和游戏开发中,**图片淡入淡出(FadeIn/Out)**是一种常见且实用的视觉过渡效果,它可以用于启动画面、场景切换、轮播图、提示框弹出等场景,通过... 目录1. 项目背景详细介绍2. 项目需求详细介绍2.1 功能需求2.2 非功能需求3. 相关技术详细

Python实现获取带合并单元格的表格数据

《Python实现获取带合并单元格的表格数据》由于在日常运维中经常出现一些合并单元格的表格,如果要获取数据比较麻烦,所以本文我们就来聊聊如何使用Python实现获取带合并单元格的表格数据吧... 由于在日常运维中经常出现一些合并单元格的表格,如果要获取数据比较麻烦,现将将封装成类,并通过调用list_exc

Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例

《Nginx使用Keepalived部署web集群(高可用高性能负载均衡)实战案例》本文介绍Nginx+Keepalived实现Web集群高可用负载均衡的部署与测试,涵盖架构设计、环境配置、健康检查、... 目录前言一、架构设计二、环境准备三、案例部署配置 前端 Keepalived配置 前端 Nginx

Python logging模块使用示例详解

《Pythonlogging模块使用示例详解》Python的logging模块是一个灵活且强大的日志记录工具,广泛应用于应用程序的调试、运行监控和问题排查,下面给大家介绍Pythonlogging模... 目录一、为什么使用 logging 模块?二、核心组件三、日志级别四、基本使用步骤五、快速配置(bas

使用animation.css库快速实现CSS3旋转动画效果

《使用animation.css库快速实现CSS3旋转动画效果》随着Web技术的不断发展,动画效果已经成为了网页设计中不可或缺的一部分,本文将深入探讨animation.css的工作原理,如何使用以及... 目录1. css3动画技术简介2. animation.css库介绍2.1 animation.cs

Java进行日期解析与格式化的实现代码

《Java进行日期解析与格式化的实现代码》使用Java搭配ApacheCommonsLang3和Natty库,可以实现灵活高效的日期解析与格式化,本文将通过相关示例为大家讲讲具体的实践操作,需要的可以... 目录一、背景二、依赖介绍1. Apache Commons Lang32. Natty三、核心实现代

使用雪花算法产生id导致前端精度缺失问题解决方案

《使用雪花算法产生id导致前端精度缺失问题解决方案》雪花算法由Twitter提出,设计目的是生成唯一的、递增的ID,下面:本文主要介绍使用雪花算法产生id导致前端精度缺失问题的解决方案,文中通过代... 目录一、问题根源二、解决方案1. 全局配置Jackson序列化规则2. 实体类必须使用Long封装类3.