【MindSpore:跟着小Mi机器学习】推荐系统

2024-01-07 16:32

本文主要是介绍【MindSpore:跟着小Mi机器学习】推荐系统,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一周未见,甚是想念,今天小Mi带大家学习推荐系统(Recommender Systems)!推荐系统是机器学习中一个很重要的应用,比如某易推荐的歌曲呀,某宝推荐的购物清单呀等等,既然应该这么广泛,那就废话不多说,我们开始吧~

定义

推荐系统是个很有意思的问题,机器学习的学术会议上通常不太会关注推荐系统问题,但是在我们生活中却随处可见。

同时对机器学习来说,特征是很重要的,选择的特征将对学习算法的性能有很大影响。因此,在机器学习中有一种大思想,针对一些问题,可以通过算法自动学习一套比较好的特征,从而代替手动设计,其中推荐系统就是类型设置的一个例子。

那么什么是推荐系统问题呢?我们从一个例子开始定义推荐系统的问题。

假使一个电影供应商有5部电影和4个用户,我们要求用户为电影打分。

前三部电影是爱情片,后两部则是动作片,图中可以发现Alice和Bob似乎更倾向与爱情片,而Carol和Dave似乎更倾向与动作片,同时每个用户都并未给全部的电影都打过分。这时可以构建一个算法,预测每个人可能会给各自没看过的电影打多少分,并以此作为推荐的依据。

下面引入一些相关参数:

:用户数量;

:电影数量;

:如果用户

给电影

评过分,则

:用户

给电影

的评分;

:用户

评过分的电影总数。

特征与算法

在一个基于内容的推荐系统算法中,对于用户希望推荐的电影有一些数据,而这些数据更准确地说就是相关的特征。

假设每部电影都有两个特征,

如代表电影的浪漫程度,

代表电影的动作程度。

那么每部电影都有一个特征向量,如

是第一部电影的特征向量:[0.9 0]。

基于这些特征来构建一个推荐系统算法,采用线性回归模型,我们可以针对每一个用户都训练一个线性回归模型,如

是第一个用户的模型参数。于是就有:

:用户

的参数向量;

:电影

的特征向量;

对于用户

和电影

,我们预测评分为:

代价函数

针对用户

,该线性回归模型的代价为预测误差的平方和,加上正则化项:

其中

表示只计算那些用户

评过分的电影。在一般的线性回归模型中,误差项和正则项应该都是乘以

,在这里的话我们选择将

去掉,同时也不会对方差项

进行正则化处理。

上面的代价函数只是针对一个用户的,为了学习所有用户,将所有用户的代价函数求和:

如果要用梯度下降法来求解最优解,计算代价函数的偏导数后得到梯度下降的更新公式为:

3 协同过滤

在基于内容的推荐系统中,对于每一部电影,我们都掌握了可用的特征,使用这些特征训练出了每一个用户的参数。举一反三,如果我们拥有用户的参数,那么其实也可以学习得出电影的特征,有没有?!

但是如果既没有用户的参数,也没有电影的特征,那么应该如何解决呢?不用担心,协同过滤算法闪亮登场~

优化目标将同时针对

进行,对代价函数求偏导数的结果如下:

注:在协同过滤算法中,通常不使用方差项,如果需要的话,算法会自动学得。 协同过滤算法使用步骤如下:

1.初始

为一些随机小值

2.使用梯度下降算法最小化代价函数

3.在训练完算法后,预测

为用户

给电影

的评分

通过这个学习过程获得的特征矩阵包含了有关电影的重要数据,可以用这些数据作为给用户推荐电影的依据。

例如,如果一位用户正在观看电影

,寻找另一部电影

,依据两部电影的特征向量之间的距离大小

,距离越小,那么

就越符合该用户的品味。

4 协同过滤算法

协同过滤优化目标:

给定

,估计:

给定

,估计

,同时最小化

算法的向量化实现

根据五部电影的数据集,将这些用户的电影评分,进行分组并存到一个矩阵中。

由于数据集有五部电影和四位用户,那么这个矩阵Y就是一个5行4列的矩阵,同时包含了这些电影的用户评分数据:

推出评分:

找到相关影片:

前期小Mi已经带大家对特征参数向量进行了学习,那么其实如何度量两部电影之间的相似性就很好解决啦。例如说:电影

有一个特征向量

,而另一部不同的电影

,只要保证两部电影的特征向量之间的距离

很小,那就能很有力地表明电影

和电影

在某种程度上有相似,至少在某种意义上,某些人喜欢电影

,或许更有可能也对电影

感兴趣。也就是说,当用户在看某部电影

的时候,如果需要找出5部与电影

非常相似的电影,为了能给用户推荐5部新电影,我们需要做的是找出电影

,在这些不同的电影中与我们要找的电影

的距离最小,这样你就能给你的用户推荐几部不同的电影了。

通过这个方法,相信大家可以知道,应该如何进行一个向量化的计算来对所有的用户和所有的电影进行评分计算,同时也能掌握通过学习特征参数,来找到相关电影和产品的方法。

6 均值归一化

用户评分数据:

如果新增一个用户Sky,并且Sky没有为任何电影评分,那么我们以什么为依据为Sky推荐电影呢?

首先需要对矩阵Y进行均值归一化处理,将每一个用户对某一部电影的评分减去所有用户对该电影评分的平均值:

然后利用这个新的矩阵来训练算法,如果我们要用新训练出的算法来预测评分,则需要将平均值重新加回去,预测

,而对于用户Sky,新模型会认为她给每部电影的评分都是该电影的平均分。

好啦,对于推荐系统的学习就先到这咯~下周小Mi给大家安排大规模机器学习!我们,下周再见呦(挥手十分钟!)

这篇关于【MindSpore:跟着小Mi机器学习】推荐系统的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/580551

相关文章

Mac系统下卸载JAVA和JDK的步骤

《Mac系统下卸载JAVA和JDK的步骤》JDK是Java语言的软件开发工具包,它提供了开发和运行Java应用程序所需的工具、库和资源,:本文主要介绍Mac系统下卸载JAVA和JDK的相关资料,需... 目录1. 卸载系统自带的 Java 版本检查当前 Java 版本通过命令卸载系统 Java2. 卸载自定

CSS Anchor Positioning重新定义锚点定位的时代来临(最新推荐)

《CSSAnchorPositioning重新定义锚点定位的时代来临(最新推荐)》CSSAnchorPositioning是一项仍在草案中的新特性,由Chrome125开始提供原生支持需... 目录 css Anchor Positioning:重新定义「锚定定位」的时代来了! 什么是 Anchor Pos

Java SWT库详解与安装指南(最新推荐)

《JavaSWT库详解与安装指南(最新推荐)》:本文主要介绍JavaSWT库详解与安装指南,在本章中,我们介绍了如何下载、安装SWTJAR包,并详述了在Eclipse以及命令行环境中配置Java... 目录1. Java SWT类库概述2. SWT与AWT和Swing的区别2.1 历史背景与设计理念2.1.

基于Python实现一个简单的题库与在线考试系统

《基于Python实现一个简单的题库与在线考试系统》在当今信息化教育时代,在线学习与考试系统已成为教育技术领域的重要组成部分,本文就来介绍一下如何使用Python和PyQt5框架开发一个名为白泽题库系... 目录概述功能特点界面展示系统架构设计类结构图Excel题库填写格式模板题库题目填写格式表核心数据结构

Go学习记录之runtime包深入解析

《Go学习记录之runtime包深入解析》Go语言runtime包管理运行时环境,涵盖goroutine调度、内存分配、垃圾回收、类型信息等核心功能,:本文主要介绍Go学习记录之runtime包的... 目录前言:一、runtime包内容学习1、作用:① Goroutine和并发控制:② 垃圾回收:③ 栈和

Java日期类详解(最新推荐)

《Java日期类详解(最新推荐)》早期版本主要使用java.util.Date、java.util.Calendar等类,Java8及以后引入了新的日期和时间API(JSR310),包含在ja... 目录旧的日期时间API新的日期时间 API(Java 8+)获取时间戳时间计算与其他日期时间类型的转换Dur

Linux系统中的firewall-offline-cmd详解(收藏版)

《Linux系统中的firewall-offline-cmd详解(收藏版)》firewall-offline-cmd是firewalld的一个命令行工具,专门设计用于在没有运行firewalld服务的... 目录主要用途基本语法选项1. 状态管理2. 区域管理3. 服务管理4. 端口管理5. ICMP 阻断

Android学习总结之Java和kotlin区别超详细分析

《Android学习总结之Java和kotlin区别超详细分析》Java和Kotlin都是用于Android开发的编程语言,它们各自具有独特的特点和优势,:本文主要介绍Android学习总结之Ja... 目录一、空安全机制真题 1:Kotlin 如何解决 Java 的 NullPointerExceptio

Windows 系统下 Nginx 的配置步骤详解

《Windows系统下Nginx的配置步骤详解》Nginx是一款功能强大的软件,在互联网领域有广泛应用,简单来说,它就像一个聪明的交通指挥员,能让网站运行得更高效、更稳定,:本文主要介绍W... 目录一、为什么要用 Nginx二、Windows 系统下 Nginx 的配置步骤1. 下载 Nginx2. 解压

如何确定哪些软件是Mac系统自带的? Mac系统内置应用查看技巧

《如何确定哪些软件是Mac系统自带的?Mac系统内置应用查看技巧》如何确定哪些软件是Mac系统自带的?mac系统中有很多自带的应用,想要看看哪些是系统自带,该怎么查看呢?下面我们就来看看Mac系统内... 在MAC电脑上,可以使用以下方法来确定哪些软件是系统自带的:1.应用程序文件夹打开应用程序文件夹