风暴项目个性化推荐系统浅析

2024-09-07 19:32

本文主要是介绍风暴项目个性化推荐系统浅析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

风暴项目的主要任务是搭建自媒体平台,作为主开发人员的我希望把工作重心放在个性化推荐系统上。

目前风暴项目的个性化推荐是基于用户行为信息记录实现的,也就是说对于每条资讯,数据库中有字段标明其类型。建立一张用户浏览表,对用户的浏览行为进行记录,从中可以获取当前用户对哪类资讯感兴趣。

若用户第一次登陆,则按默认规则选取热点资讯做推荐,及所有资讯按浏览量降序排序,取前4个。另外,我考虑到后期可能有商业合作,需要人为的推荐上榜(参考新浪微博的上热点)。所以对于每条资讯,再增加is_hot字段,扫描所有资讯,把人为推荐的热点加入推荐列表。

若用户不是第一次登录,则查找该用户的浏览记录,取其浏览量最多的资讯类型,对该类型下资讯降序排列,取前4个。然后考虑人为推荐,操作同上。

-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------

(分割线)

曾经看过一段时间机器学习,颇感兴趣。所以,我考虑后期采用基于用户的协同过滤算法对个性化推荐系统进行改进。

首先,我们的推荐是基于用户的,也就是说对于当前用户,我们找到跟他兴趣喜好相近的K个用户,依据这K个用户对当前用户进行资讯推荐。这里需要对资讯的喜好标识做下规定,每条资讯1~5分,由用户进行评判,据此得出用户的喜好。

然后,如何找到跟他喜好相近的用户。遍历整张表去查找跟当前用户有相同喜好的其他用户固然可行,一旦这张表过大,遍历必然耗时。所以建立一张资讯用户反查表,记录该条资讯有哪些用户喜欢,这样可以快速的找到和当前用户有相近喜好的所有用户。

接下来就是相似度计算,这里我采用余弦相似性计算,cos(a,b) = <a,b>/ (|a|*|b|),a、b均为向量。分别计算出的每个用户和当前用户的相似度,据此找出与当前用户喜好相近的前K个用户。

最后,我们根据之前计算出的相似度作为权值,每条资讯作权值和对应用户喜欢的乘积累加和,结果降序排列取前4即可。


总结:

1.计算其他用户和你的相似度,利用反查表排除与你无关的用户。

2.根据相似度降序取前K个与你喜好相近的用户。

3.在K个用户喜欢的资讯里,根据相似度计算每条资讯的推荐度

4.根据推荐度降序推荐资讯。

这篇关于风暴项目个性化推荐系统浅析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1145958

相关文章

vite搭建vue3项目的搭建步骤

《vite搭建vue3项目的搭建步骤》本文主要介绍了vite搭建vue3项目的搭建步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学... 目录1.确保Nodejs环境2.使用vite-cli工具3.进入项目安装依赖1.确保Nodejs环境

idea+spring boot创建项目的搭建全过程

《idea+springboot创建项目的搭建全过程》SpringBoot是Spring社区发布的一个开源项目,旨在帮助开发者快速并且更简单的构建项目,:本文主要介绍idea+springb... 目录一.idea四种搭建方式1.Javaidea命名规范2JavaWebTomcat的安装一.明确tomcat

pycharm跑python项目易出错的问题总结

《pycharm跑python项目易出错的问题总结》:本文主要介绍pycharm跑python项目易出错问题的相关资料,当你在PyCharm中运行Python程序时遇到报错,可以按照以下步骤进行排... 1. 一定不要在pycharm终端里面创建环境安装别人的项目子模块等,有可能出现的问题就是你不报错都安装

linux系统中java的cacerts的优先级详解

《linux系统中java的cacerts的优先级详解》文章讲解了Java信任库(cacerts)的优先级与管理方式,指出JDK自带的cacerts默认优先级更高,系统级cacerts需手动同步或显式... 目录Java 默认使用哪个?如何检查当前使用的信任库?简要了解Java的信任库总结了解 Java 信

uni-app小程序项目中实现前端图片压缩实现方式(附详细代码)

《uni-app小程序项目中实现前端图片压缩实现方式(附详细代码)》在uni-app开发中,文件上传和图片处理是很常见的需求,但也经常会遇到各种问题,下面:本文主要介绍uni-app小程序项目中实... 目录方式一:使用<canvas>实现图片压缩(推荐,兼容性好)示例代码(小程序平台):方式二:使用uni

macOS彻底卸载Python的超完整指南(推荐!)

《macOS彻底卸载Python的超完整指南(推荐!)》随着python解释器的不断更新升级和项目开发需要,有时候会需要升级或者降级系统中的python的版本,系统中留存的Pytho版本如果没有卸载干... 目录MACOS 彻底卸载 python 的完整指南重要警告卸载前检查卸载方法(按安装方式)1. 卸载

MyCat分库分表的项目实践

《MyCat分库分表的项目实践》分库分表解决大数据量和高并发性能瓶颈,MyCat作为中间件支持分片、读写分离与事务处理,本文就来介绍一下MyCat分库分表的实践,感兴趣的可以了解一下... 目录一、为什么要分库分表?二、分库分表的常见方案三、MyCat简介四、MyCat分库分表深度解析1. 架构原理2. 分

Oracle数据库在windows系统上重启步骤

《Oracle数据库在windows系统上重启步骤》有时候在服务中重启了oracle之后,数据库并不能正常访问,下面:本文主要介绍Oracle数据库在windows系统上重启的相关资料,文中通过代... oracle数据库在Windows上重启的方法我这里是使用oracle自带的sqlplus工具实现的方

linux查找java项目日志查找报错信息方式

《linux查找java项目日志查找报错信息方式》日志查找定位步骤:进入项目,用tail-f实时跟踪日志,tail-n1000查看末尾1000行,grep搜索关键词或时间,vim内精准查找并高亮定位,... 目录日志查找定位在当前文件里找到报错消息总结日志查找定位1.cd 进入项目2.正常日志 和错误日

在.NET项目中嵌入Python代码的实践指南

《在.NET项目中嵌入Python代码的实践指南》在现代开发中,.NET与Python的协作需求日益增长,从机器学习模型集成到科学计算,从脚本自动化到数据分析,然而,传统的解决方案(如HTTPAPI或... 目录一、CSnakes vs python.NET:为何选择 CSnakes?二、环境准备:从 Py