无处不在的推荐系统

2024-04-03 02:48
文章标签 系统 推荐 无处不在

本文主要是介绍无处不在的推荐系统,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

这篇博客由微软主要研究者Thore Graepel执笔并发表。

博客正文

好的推荐任何地方都用得着。无论是找一部你可能喜欢的电影,或者一本你可能感兴趣的书籍,甚至是寻求facebook或linkedin上志同道合的朋友,自动推荐系统将会是个得力助手。刚开始自动推荐系统只限于网络用户,如今,随着微软Azure机器学习的不断普及,越来越多的人可以享受到自动推荐系统的优质服务,小到个人大到企业,为其客户带来便利。

自推系统如何是如何运作的?

一般而言,推荐系统是个二元体系,一个是”用户”,另一个是”商品”。用户指推荐物品的对象人群,”商品”指你想要推荐的物品,可以是电影,书籍,网页,菜谱,甚至是网友。

举个例子,假如我想给一个指定用户推荐饭店,参考该用户以及其他用户对其中一些饭店的历史评价(五星评价标准)。我们的推荐任务可以分两步走:

  • 预测该用户会如何评价每个饭店(五星评价标准)。
  • 从一份合格饭店清单中选出该用户可能会给出最高评分的饭店。

但是如果某个用户没有评价过这些饭店,那我们如何预测该用户的评价走向呢?机器学习发挥作用的时候到了。

如何预测评价?

针对”用户–商品”这种模式,我们需要收集各种形式的数据(用户ID,商品ID,评价等)来建立一个机器学习预测性模型,预测用户的评价走向。

你可以把它想成一个大型矩阵,用户为行,商品为列,而评分就是元素。大数据

这是个稀疏矩阵(大量条目缺失),因为普通用户只会给一小部分商品评分。Azure中贝叶斯推荐系统小工具(Bayesian RS implemented接收这些训练数据,设计相应的模型,预测该用户的评价结果,应用于“用户–商品”模式。评价标准不限于五星评级,只要不要涉及到隐私,比如购买次数,点击量或购买所花时间等判断标准也同样可行。

以上是如何做到的呢?

RS将用户和商品嵌入我们称之为潜在特质空间的地方(见下图)。如果用户(蓝点)和商品(红点)向量方向一致,那么该用户对该商品评价很高。反之则评价一般。特质空间里,相关用户和相似商品会放到一起,使”指定用户——商品”模式下预测用户评价成为可能,而训练数据库里是不提供评价的。

下图是一个二维特质空间,用来作阐述说明,而我们系统中使用20-100个维度的特质空间来分析。有时我们可以发现一些可以解释的特质,举个例子。南北走向的特质可能指“成人”和“小孩”,而东西走向的特质可能为“主流”和“小众”。大数据

面对新用户和新商品如何作出预测?

RS的唯一问题在于它属于慢热型产品。新用户作评价的次数不多,新商品收到的评价数也寥寥无几,因此很难作出预测。为了改善这一问题,Azure不仅使用ID来表示用户和商品,还使用了一种由元数据构成的特质向量。代表用户的特质向量包含所有个人信息,比如年龄,所在地等;代表电影的特质向量包括电影题材,演员,导演,上映日期等。最后,系统会利用元数据中的共同特质整合出相关用户和相似商品。

了解更多

如果你对自动推荐系统很好奇,可以看看Matchbox的论文: Large Scale Bayesian Recommendations.

如果你想建立自己的推荐系统传送通道,等Azure机器学习正式发布后,可以自己动手尝试一下。

下图所示的Azure机器学习工作室,备有一个推荐系统模板和功能强大的浏览器支持的用户界面,还有”拖动”功能,让整个过程变得相对简单。大数据

事实上,Azure机器学习预测用户评价结果包括两大模式——内容筛选和协作筛选。最后通过普及该应用,我们希望会有更多的人使用自动推荐系统,并在各种场合中发挥作用。

来自:http://www.36dsj.com/archives/28944

这篇关于无处不在的推荐系统的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/871717

相关文章

Linux系统中查询JDK安装目录的几种常用方法

《Linux系统中查询JDK安装目录的几种常用方法》:本文主要介绍Linux系统中查询JDK安装目录的几种常用方法,方法分别是通过update-alternatives、Java命令、环境变量及目... 目录方法 1:通过update-alternatives查询(推荐)方法 2:检查所有已安装的 JDK方

Linux系统之lvcreate命令使用解读

《Linux系统之lvcreate命令使用解读》lvcreate是LVM中创建逻辑卷的核心命令,支持线性、条带化、RAID、镜像、快照、瘦池和缓存池等多种类型,实现灵活存储资源管理,需注意空间分配、R... 目录lvcreate命令详解一、命令概述二、语法格式三、核心功能四、选项详解五、使用示例1. 创建逻

使用Python构建一个高效的日志处理系统

《使用Python构建一个高效的日志处理系统》这篇文章主要为大家详细讲解了如何使用Python开发一个专业的日志分析工具,能够自动化处理、分析和可视化各类日志文件,大幅提升运维效率,需要的可以了解下... 目录环境准备工具功能概述完整代码实现代码深度解析1. 类设计与初始化2. 日志解析核心逻辑3. 文件处

golang程序打包成脚本部署到Linux系统方式

《golang程序打包成脚本部署到Linux系统方式》Golang程序通过本地编译(设置GOOS为linux生成无后缀二进制文件),上传至Linux服务器后赋权执行,使用nohup命令实现后台运行,完... 目录本地编译golang程序上传Golang二进制文件到linux服务器总结本地编译Golang程序

Spring Boot spring-boot-maven-plugin 参数配置详解(最新推荐)

《SpringBootspring-boot-maven-plugin参数配置详解(最新推荐)》文章介绍了SpringBootMaven插件的5个核心目标(repackage、run、start... 目录一 spring-boot-maven-plugin 插件的5个Goals二 应用场景1 重新打包应用

Linux系统性能检测命令详解

《Linux系统性能检测命令详解》本文介绍了Linux系统常用的监控命令(如top、vmstat、iostat、htop等)及其参数功能,涵盖进程状态、内存使用、磁盘I/O、系统负载等多维度资源监控,... 目录toppsuptimevmstatIOStatiotopslabtophtopdstatnmon

Knife4j+Axios+Redis前后端分离架构下的 API 管理与会话方案(最新推荐)

《Knife4j+Axios+Redis前后端分离架构下的API管理与会话方案(最新推荐)》本文主要介绍了Swagger与Knife4j的配置要点、前后端对接方法以及分布式Session实现原理,... 目录一、Swagger 与 Knife4j 的深度理解及配置要点Knife4j 配置关键要点1.Spri

Qt QCustomPlot库简介(最新推荐)

《QtQCustomPlot库简介(最新推荐)》QCustomPlot是一款基于Qt的高性能C++绘图库,专为二维数据可视化设计,它具有轻量级、实时处理百万级数据和多图层支持等特点,适用于科学计算、... 目录核心特性概览核心组件解析1.绘图核心 (QCustomPlot类)2.数据容器 (QCPDataC

Java内存分配与JVM参数详解(推荐)

《Java内存分配与JVM参数详解(推荐)》本文详解JVM内存结构与参数调整,涵盖堆分代、元空间、GC选择及优化策略,帮助开发者提升性能、避免内存泄漏,本文给大家介绍Java内存分配与JVM参数详解,... 目录引言JVM内存结构JVM参数概述堆内存分配年轻代与老年代调整堆内存大小调整年轻代与老年代比例元空

深度解析Java DTO(最新推荐)

《深度解析JavaDTO(最新推荐)》DTO(DataTransferObject)是一种用于在不同层(如Controller层、Service层)之间传输数据的对象设计模式,其核心目的是封装数据,... 目录一、什么是DTO?DTO的核心特点:二、为什么需要DTO?(对比Entity)三、实际应用场景解析