比较购物搜索之相似关键词的设计与实现——货比百家(huobibaiija.com)

本文主要是介绍比较购物搜索之相似关键词的设计与实现——货比百家(huobibaiija.com),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这段时间一直忙着货比百家比较购物搜索(huobibaijia.com)的SEO工作,经过网站结构调整、关键词布局和外链建设,百度对网站已经稳定收录,站长工具查询:"百度 在最近1天内 共收录了网站( www.huobibaijia.com 1010 个页面",总收录数量:7万2400。(2011-09-20)

在实现购物搜索应用的时候,时常会遇到,类似淘宝搜索结果页面"你是不是想找:",etao搜索结果页搜索框下"热门搜索"之类的需求,也即根据当前的搜索关键词,查询相类似的关键词。

从seo和网站已有结构考虑,热门关键词用独立的页面展示,URL设计如:http://www.huobibaijia.com/hot-5176/

和http://www.huobibaijia.com/nvxie-50006843/hot-5176/。相似关键词实现效果如:


说下实现细节,首先需要一个关键词库,这个可以统计用户搜索关键词,也可以搜集商城的热门关键词。写了简单的程序,统计了淘宝、淘宝商城的热门关键词10多万个作为关键词库。

 

相似查询,不得不提TF-IDF了。TF-IDF(term frequency–inverse document frequency)是一种用于资讯检索与资讯探勘的常用加权技术。主要思想是:如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类别区分能力,适合用来分类。 TFIDF实际上是:TF * IDF,TF词频(Term Frequency),IDF反文档频率(Inverse Document Frequency)。

 

Lucene也提供了个相似比较的接口,MoreLikeThis接口。废话不说了,直接上代码。

 

热门关键词推荐代码:

	public List<Hotkey> searchMoreLikeThis(String wd, int top)throws IOException, Exception {MoreLikeThisQuery query = new MoreLikeThisQuery(wd,new String[] { "wd" }, analyzerUtil.ikAnalyzer);TopDocs topDocs = getSearcher().search(query, top);int totalHits = topDocs.totalHits;ScoreDoc scoreDocs[] = topDocs.scoreDocs;top = top < totalHits ? top : totalHits;List<Hotkey> list = new ArrayList<Hotkey>();for (int i = 0; i < top; i++) {Document doc = getSearcher().doc(scoreDocs[i].doc);Hotkey hotkey = doc2Object(doc);int freq = taobaoItemSearcher.docFreq(hotkey.getWd());//...此处暂时隐蔽^_^list.add(doc2Object(doc));}return list;}
 

 

有兴趣的朋友看看网站,提提建议。技术、网站运营、SEO等有兴趣的朋友,多多交流。

网址: http://www.huobibaijia.com/

也可以加QQ:909546261,疑义相与析。

 


这篇关于比较购物搜索之相似关键词的设计与实现——货比百家(huobibaiija.com)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/340069

相关文章

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java AOP面向切面编程的概念和实现方式

《JavaAOP面向切面编程的概念和实现方式》AOP是面向切面编程,通过动态代理将横切关注点(如日志、事务)与核心业务逻辑分离,提升代码复用性和可维护性,本文给大家介绍JavaAOP面向切面编程的概... 目录一、AOP 是什么?二、AOP 的核心概念与实现方式核心概念实现方式三、Spring AOP 的关

Python实现字典转字符串的五种方法

《Python实现字典转字符串的五种方法》本文介绍了在Python中如何将字典数据结构转换为字符串格式的多种方法,首先可以通过内置的str()函数进行简单转换;其次利用ison.dumps()函数能够... 目录1、使用json模块的dumps方法:2、使用str方法:3、使用循环和字符串拼接:4、使用字符

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

Linux挂载linux/Windows共享目录实现方式

《Linux挂载linux/Windows共享目录实现方式》:本文主要介绍Linux挂载linux/Windows共享目录实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录文件共享协议linux环境作为服务端(NFS)在服务器端安装 NFS创建要共享的目录修改 NFS 配

通过React实现页面的无限滚动效果

《通过React实现页面的无限滚动效果》今天我们来聊聊无限滚动这个现代Web开发中不可或缺的技术,无论你是刷微博、逛知乎还是看脚本,无限滚动都已经渗透到我们日常的浏览体验中,那么,如何优雅地实现它呢?... 目录1. 早期的解决方案2. 交叉观察者:IntersectionObserver2.1 Inter

Spring Gateway动态路由实现方案

《SpringGateway动态路由实现方案》本文主要介绍了SpringGateway动态路由实现方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随... 目录前沿何为路由RouteDefinitionRouteLocator工作流程动态路由实现尾巴前沿S

JavaScript对象转数组的三种方法实现

《JavaScript对象转数组的三种方法实现》本文介绍了在JavaScript中将对象转换为数组的三种实用方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友... 目录方法1:使用Object.keys()和Array.map()方法2:使用Object.entr

k8s中实现mysql主备过程详解

《k8s中实现mysql主备过程详解》文章讲解了在K8s中使用StatefulSet部署MySQL主备架构,包含NFS安装、storageClass配置、MySQL部署及同步检查步骤,确保主备数据一致... 目录一、k8s中实现mysql主备1.1 环境信息1.2 部署nfs-provisioner1.2.

Java高效实现PowerPoint转PDF的示例详解

《Java高效实现PowerPoint转PDF的示例详解》在日常开发或办公场景中,经常需要将PowerPoint演示文稿(PPT/PPTX)转换为PDF,本文将介绍从基础转换到高级设置的多种用法,大家... 目录为什么要将 PowerPoint 转换为 PDF安装 Spire.Presentation fo