【MindSpore：跟着小Mi机器学习】推荐系统

2024-01-07 16:32

文章标签 系统学习推荐机器跟着 mindspore mi

本文主要是介绍【MindSpore：跟着小Mi机器学习】推荐系统，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

一周未见，甚是想念，今天小Mi带大家学习推荐系统(Recommender Systems)！推荐系统是机器学习中一个很重要的应用，比如某易推荐的歌曲呀，某宝推荐的购物清单呀等等，既然应该这么广泛，那就废话不多说，我们开始吧~

1 定义

推荐系统是个很有意思的问题，机器学习的学术会议上通常不太会关注推荐系统问题，但是在我们生活中却随处可见。

同时对机器学习来说，特征是很重要的，选择的特征将对学习算法的性能有很大影响。因此，在机器学习中有一种大思想，针对一些问题，可以通过算法自动学习一套比较好的特征，从而代替手动设计，其中推荐系统就是类型设置的一个例子。

那么什么是推荐系统问题呢？我们从一个例子开始定义推荐系统的问题。

假使一个电影供应商有5部电影和4个用户，我们要求用户为电影打分。

前三部电影是爱情片，后两部则是动作片，图中可以发现Alice和Bob似乎更倾向与爱情片，而Carol和Dave似乎更倾向与动作片，同时每个用户都并未给全部的电影都打过分。这时可以构建一个算法，预测每个人可能会给各自没看过的电影打多少分，并以此作为推荐的依据。

下面引入一些相关参数：

：用户数量；

：电影数量；

：如果用户

给电影

评过分，则

；

：用户

给电影

的评分；

：用户

评过分的电影总数。

2 特征与算法

在一个基于内容的推荐系统算法中，对于用户希望推荐的电影有一些数据，而这些数据更准确地说就是相关的特征。

假设每部电影都有两个特征，

如代表电影的浪漫程度，

代表电影的动作程度。

那么每部电影都有一个特征向量，如

是第一部电影的特征向量：[0.9 0]。

基于这些特征来构建一个推荐系统算法，采用线性回归模型，我们可以针对每一个用户都训练一个线性回归模型，如

是第一个用户的模型参数。于是就有：

：用户

的参数向量；

：电影

的特征向量；

对于用户

和电影

，我们预测评分为：

；

代价函数

针对用户

，该线性回归模型的代价为预测误差的平方和，加上正则化项：

其中

表示只计算那些用户

评过分的电影。在一般的线性回归模型中，误差项和正则项应该都是乘以

，在这里的话我们选择将

去掉，同时也不会对方差项

进行正则化处理。

上面的代价函数只是针对一个用户的，为了学习所有用户，将所有用户的代价函数求和：

如果要用梯度下降法来求解最优解，计算代价函数的偏导数后得到梯度下降的更新公式为：

3 协同过滤

在基于内容的推荐系统中，对于每一部电影，我们都掌握了可用的特征，使用这些特征训练出了每一个用户的参数。举一反三，如果我们拥有用户的参数，那么其实也可以学习得出电影的特征，有没有？！

但是如果既没有用户的参数，也没有电影的特征，那么应该如何解决呢？不用担心，协同过滤算法闪亮登场~

优化目标将同时针对

和

进行，对代价函数求偏导数的结果如下：

注：在协同过滤算法中，通常不使用方差项，如果需要的话，算法会自动学得。协同过滤算法使用步骤如下：

1.初始

为一些随机小值

2.使用梯度下降算法最小化代价函数

3.在训练完算法后，预测

为用户

给电影

的评分

通过这个学习过程获得的特征矩阵包含了有关电影的重要数据，可以用这些数据作为给用户推荐电影的依据。

例如，如果一位用户正在观看电影

，寻找另一部电影

，依据两部电影的特征向量之间的距离大小

，距离越小，那么

就越符合该用户的品味。

4 协同过滤算法

协同过滤优化目标：

给定

，估计：

：

给定

，估计

，同时最小化

和

：

5 算法的向量化实现

根据五部电影的数据集，将这些用户的电影评分，进行分组并存到一个矩阵中。

由于数据集有五部电影和四位用户，那么这个矩阵Y就是一个5行4列的矩阵，同时包含了这些电影的用户评分数据：

推出评分：

找到相关影片：

前期小Mi已经带大家对特征参数向量进行了学习，那么其实如何度量两部电影之间的相似性就很好解决啦。例如说：电影

有一个特征向量

，而另一部不同的电影

，只要保证两部电影的特征向量之间的距离

和

很小，那就能很有力地表明电影

和电影

在某种程度上有相似，至少在某种意义上，某些人喜欢电影

，或许更有可能也对电影

感兴趣。也就是说，当用户在看某部电影

的时候，如果需要找出5部与电影

非常相似的电影，为了能给用户推荐5部新电影，我们需要做的是找出电影

，在这些不同的电影中与我们要找的电影

的距离最小，这样你就能给你的用户推荐几部不同的电影了。

通过这个方法，相信大家可以知道，应该如何进行一个向量化的计算来对所有的用户和所有的电影进行评分计算，同时也能掌握通过学习特征参数，来找到相关电影和产品的方法。

6 均值归一化

用户评分数据：

如果新增一个用户Sky，并且Sky没有为任何电影评分，那么我们以什么为依据为Sky推荐电影呢？

首先需要对矩阵Y进行均值归一化处理，将每一个用户对某一部电影的评分减去所有用户对该电影评分的平均值：

然后利用这个新的矩阵来训练算法，如果我们要用新训练出的算法来预测评分，则需要将平均值重新加回去，预测

，而对于用户Sky，新模型会认为她给每部电影的评分都是该电影的平均分。

好啦，对于推荐系统的学习就先到这咯~下周小Mi给大家安排大规模机器学习！我们，下周再见呦（挥手十分钟！）

这篇关于【MindSpore：跟着小Mi机器学习】推荐系统的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/580551。 23002807@qq.com

相关文章

linux系统中java的cacerts的优先级详解

linux系统中java的cacerts的优先级详解

《linux系统中java的cacerts的优先级详解》文章讲解了Java信任库（cacerts）的优先级与管理方式,指出JDK自带的cacerts默认优先级更高,系统级cacerts需手动同步或显式... 目录Java 默认使用哪个？如何检查当前使用的信任库？简要了解Java的信任库总结了解 Java 信

阅读更多...

macOS彻底卸载Python的超完整指南(推荐!)

macOS彻底卸载Python的超完整指南(推荐!)

《macOS彻底卸载Python的超完整指南(推荐!)》随着python解释器的不断更新升级和项目开发需要,有时候会需要升级或者降级系统中的python的版本,系统中留存的Pytho版本如果没有卸载干... 目录MACOS 彻底卸载 python 的完整指南重要警告卸载前检查卸载方法（按安装方式）1. 卸载

阅读更多...

Oracle数据库在windows系统上重启步骤

Oracle数据库在windows系统上重启步骤

《Oracle数据库在windows系统上重启步骤》有时候在服务中重启了oracle之后,数据库并不能正常访问,下面：本文主要介绍Oracle数据库在windows系统上重启的相关资料,文中通过代... oracle数据库在Windows上重启的方法我这里是使用oracle自带的sqlplus工具实现的方

阅读更多...

JWT + 拦截器实现无状态登录系统

JWT + 拦截器实现无状态登录系统

《JWT+拦截器实现无状态登录系统》JWT（JSONWebToken）提供了一种无状态的解决方案：用户登录后,服务器返回一个Token,后续请求携带该Token即可完成身份验证,无需服务器存储会话... 目录✅ 引言一、JWT 是什么？二、技术选型三、项目结构四、核心代码实现4.1 添加依赖（pom

阅读更多...

基于Python实现自动化邮件发送系统的完整指南

基于Python实现自动化邮件发送系统的完整指南

《基于Python实现自动化邮件发送系统的完整指南》在现代软件开发和自动化流程中,邮件通知是一个常见且实用的功能,无论是用于发送报告、告警信息还是用户提醒,通过Python实现自动化的邮件发送功能都能... 目录一、前言：二、项目概述三、配置文件 `.env` 解析四、代码结构解析1. 导入模块2. 加载环

阅读更多...

linux系统上安装JDK8全过程

linux系统上安装JDK8全过程

《linux系统上安装JDK8全过程》文章介绍安装JDK的必要性及Linux下JDK8的安装步骤,包括卸载旧版本、下载解压、配置环境变量等,强调开发需JDK,运行可选JRE,现JDK已集成JRE... 目录为什么要安装jdk？1.查看linux系统是否有自带的jdk：2.下载jdk压缩包2.解压3.配置环境

阅读更多...

Unity新手入门学习殿堂级知识详细讲解（图文）

Unity新手入门学习殿堂级知识详细讲解（图文）

《Unity新手入门学习殿堂级知识详细讲解（图文）》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程

阅读更多...

Python学习笔记之getattr和hasattr用法示例详解

Python学习笔记之getattr和hasattr用法示例详解

《Python学习笔记之getattr和hasattr用法示例详解》在Python中,hasattr()、getattr()和setattr()是一组内置函数,用于对对象的属性进行操作和查询,这篇文章... 目录1.getattr用法详解1.1 基本作用1.2 示例1.3 原理2.hasattr用法详解2.

阅读更多...

Linux查询服务器系统版本号的多种方法

Linux查询服务器系统版本号的多种方法

《Linux查询服务器系统版本号的多种方法》在Linux系统管理和维护工作中,了解当前操作系统的版本信息是最基础也是最重要的操作之一,系统版本不仅关系到软件兼容性、安全更新策略,还直接影响到故障排查和... 目录一、引言：系统版本查询的重要性二、基础命令解析：cat /etc/Centos-release详

阅读更多...

更改linux系统的默认Python版本方式

更改linux系统的默认Python版本方式

《更改linux系统的默认Python版本方式》通过删除原Python软链接并创建指向python3.6的新链接,可切换系统默认Python版本,需注意版本冲突、环境混乱及维护问题,建议使用pyenv... 目录更改系统的默认python版本软链接软链接的特点创建软链接的命令使用场景注意事项总结更改系统的默

阅读更多...