Solrj 取出商品相似度moreLikeThis的方法

2024-06-06 04:48

本文主要是介绍Solrj 取出商品相似度moreLikeThis的方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在solr中有两种方式实现MoreLikeThis:
第一种:SearchHandler中的MoreLikeThisComponent,MoreLikeThis以组件的身份出现,适于简单应用。
第二种:MoreLikeThisHandler,MoreLikeThis作为一个单独的Handler来处理,可以应用过滤等较复杂操作。

本文给出针对第一种的solrj实现代码,如果想对结果进行过滤,等获取到结果之后在程序中过滤掉即可,缺点是相关文档数不固定。

代码如下:

import java.util.ArrayList;
import java.util.List;import org.apache.commons.lang3.StringUtils;
import org.apache.log4j.Logger;
import org.apache.solr.client.solrj.SolrQuery;
import org.apache.solr.client.solrj.impl.HttpSolrServer;
import org.apache.solr.client.solrj.response.QueryResponse;
import org.apache.solr.common.SolrDocument;
import org.apache.solr.common.SolrDocumentList;
import org.apache.solr.common.util.SimpleOrderedMap;import base.util.ConfigUtil;
import demo.bean.Article;public class SolrService {private static Logger log = Logger.getLogger(SolrService.class);private static HttpSolrServer solrServer;static {solrServer = new HttpSolrServer(ConfigUtil.getValue("solr.url"));solrServer.setConnectionTimeout(5000);}/*** 根据文章标题查相关文章。* * @param id 指定文章(文档)id* @param count 返回条数* @return 相关文章对象列表*/public static List<Article> getRelated(int id, int count) {SolrQuery query = new SolrQuery();List<Article> articles = new ArrayList<Article>();try {query.setQuery("id:" + id).setParam("fl", "id,title,score").setParam("mlt", "true").setParam("mlt.fl", "title").setParam("mlt.mindf", "1").setParam("mlt.mintf", "1").setParam("mlt.count", String.valueOf(count));QueryResponse response =  solrServer.query(query);if (response == null) return articles;@SuppressWarnings("unchecked")SimpleOrderedMap<SolrDocumentList> mltResults = (SimpleOrderedMap<SolrDocumentList>) response.getResponse().get("moreLikeThis");for (int i = 0; i < mltResults.size(); i++) {SolrDocumentList items = mltResults.getVal(i);for (SolrDocument doc : items) {String idStr = doc.getFieldValue("id").toString();if (StringUtils.equals(idStr, id+"")) continue;// 排除本身Article article = new Article();article.setId(Integer.parseInt(idStr));article.setTitle(doc.getFieldValue("title").toString());articles.add(article);}}} catch (Exception e) {log.error("从solr获取相关新闻时遇到错误", e);}return articles;}}

相关说明:
1,查询参数:
  id,文档主键,或使用其他唯一键;
  fl,需要返回的字段
  mtl.fl,根据哪些字段判断相似度
  mlt.mindf,最小文档频率,所在文档的个数小于这个值的词将不用于相似判断
  mlt.mintf,最小分词频率,在单个文档中出现频率小于这个值的词将不用于相似判断
  mlt.count,返回相似文章个数
2,如果setQuery中的查询条件,不是唯一结果,是多个文章,那么程序中会得到每个文章对应的moreLikeThis列表。
3,如果遇到org.apache.solr.search.EarlyTerminatingCollectorException,解决方案参见链接文章。

参考文档:

http://wiki.apache.org/solr/MoreLikeThis

参考:http://www.devnote.cn/article/43.html

这篇关于Solrj 取出商品相似度moreLikeThis的方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1035130

相关文章

Python安装Pandas库的两种方法

《Python安装Pandas库的两种方法》本文介绍了三种安装PythonPandas库的方法,通过cmd命令行安装并解决版本冲突,手动下载whl文件安装,更换国内镜像源加速下载,最后建议用pipli... 目录方法一:cmd命令行执行pip install pandas方法二:找到pandas下载库,然后

Linux系统中查询JDK安装目录的几种常用方法

《Linux系统中查询JDK安装目录的几种常用方法》:本文主要介绍Linux系统中查询JDK安装目录的几种常用方法,方法分别是通过update-alternatives、Java命令、环境变量及目... 目录方法 1:通过update-alternatives查询(推荐)方法 2:检查所有已安装的 JDK方

SQL Server安装时候没有中文选项的解决方法

《SQLServer安装时候没有中文选项的解决方法》用户安装SQLServer时界面全英文,无中文选项,通过修改安装设置中的国家或地区为中文中国,重启安装程序后界面恢复中文,解决了问题,对SQLSe... 你是不是在安装SQL Server时候发现安装界面和别人不同,并且无论如何都没有中文选项?这个问题也

Java Thread中join方法使用举例详解

《JavaThread中join方法使用举例详解》JavaThread中join()方法主要是让调用改方法的thread完成run方法里面的东西后,在执行join()方法后面的代码,这篇文章主要介绍... 目录前言1.join()方法的定义和作用2.join()方法的三个重载版本3.join()方法的工作原

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

《在MySQL中实现冷热数据分离的方法及使用场景底层原理解析》MySQL冷热数据分离通过分表/分区策略、数据归档和索引优化,将频繁访问的热数据与冷数据分开存储,提升查询效率并降低存储成本,适用于高并发... 目录实现冷热数据分离1. 分表策略2. 使用分区表3. 数据归档与迁移在mysql中实现冷热数据分

Spring Boot从main方法到内嵌Tomcat的全过程(自动化流程)

《SpringBoot从main方法到内嵌Tomcat的全过程(自动化流程)》SpringBoot启动始于main方法,创建SpringApplication实例,初始化上下文,准备环境,刷新容器并... 目录1. 入口:main方法2. SpringApplication初始化2.1 构造阶段3. 运行阶

Olingo分析和实践之ODataImpl详细分析(重要方法详解)

《Olingo分析和实践之ODataImpl详细分析(重要方法详解)》ODataImpl.java是ApacheOlingoOData框架的核心工厂类,负责创建序列化器、反序列化器和处理器等组件,... 目录概述主要职责类结构与继承关系核心功能分析1. 序列化器管理2. 反序列化器管理3. 处理器管理重要方

Python错误AttributeError: 'NoneType' object has no attribute问题的彻底解决方法

《Python错误AttributeError:NoneTypeobjecthasnoattribute问题的彻底解决方法》在Python项目开发和调试过程中,经常会碰到这样一个异常信息... 目录问题背景与概述错误解读:AttributeError: 'NoneType' object has no at

postgresql使用UUID函数的方法

《postgresql使用UUID函数的方法》本文给大家介绍postgresql使用UUID函数的方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录PostgreSQL有两种生成uuid的方法。可以先通过sql查看是否已安装扩展函数,和可以安装的扩展函数

Java中Arrays类和Collections类常用方法示例详解

《Java中Arrays类和Collections类常用方法示例详解》本文总结了Java中Arrays和Collections类的常用方法,涵盖数组填充、排序、搜索、复制、列表转换等操作,帮助开发者高... 目录Arrays.fill()相关用法Arrays.toString()Arrays.sort()A