octave实现协同过滤推荐算法

2024-04-25 12:18

本文主要是介绍octave实现协同过滤推荐算法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

octave实现协同过滤推荐算法

标签:推荐算法

这是对关于电影评分的数据集使用协同过滤算法,实现推荐系统。

数据来源为:电影数据

  1. 先从本地导入数据(代码如下):
%  导入数据
load ('ex8_movies.mat');
  1. 现在对矩阵可视化看看:
    矩阵可视化图片

  2. 我们可以看出,该图为Y的输出,横轴为用户,纵轴为电影,所以 Y Y 矩阵是
    nummoviesnumusers

另外对于 R R 矩阵,其Rij=1ij
另外代码中常会看到两个矩阵:
矩阵图
X大小为电影数*特征数,第i行代表第i部电影的特征,Theta大小为用户数*特征数,第j行代表第j个用户对应的参数。

4.现在开始求代价函数
代码如下:

J = 1/2 * (sum(sum(R .* (((X * Theta') - Y).^2) ))) ;
%正则化
J = J + lambda/2 * (sum(sum(X.^2))) + lambda/2 * (sum(sum(Theta.^2))) ;%梯度下降
X_grad = (R .* (X * Theta' - Y)) * Theta ;
X_grad = X_grad + lambda * X ;Theta_grad = (R .* (X * Theta' - Y))' * X ;
Theta_grad = Theta_grad + lambda * Theta ;

其中,经过正则化的公式为:
公式图片

我们更新参数公式中,损失函数梯度(这里没打出正则化,代码里正则化了)为:
梯度下降图片

调用为:

%% ========= Part 4: Collaborative Filtering Cost Regularization ========
%  Now, you should implement regularization for the cost function for 
%  collaborative filtering. You can implement it by adding the cost of
%  regularization to the original cost computation.
%  %  Evaluate cost function
J = cofiCostFunc([X(:) ; Theta(:)], Y, R, num_users, num_movies, ...num_features, 1.5);fprintf(['Cost at loaded parameters (lambda = 1.5): %f '...'\n(this value should be about 31.34)\n'], J);fprintf('\nProgram paused. Press enter to continue.\n');
pause;

好,有了这些,再加上Octave中的无约束最小化优化函数,就可以直接训练了(下面是这个优化函数调用的代码):

theta = fmincg (@(t)(cofiCostFunc(t, Y, R, num_users, num_movies, ...num_features, lambda)), ...initial_parameters, options);

现在可以看看对于一个用户它的效果了:


这里来了一个用户,且有该用户对几个电影的评分,代码如下:

%% ============== Part 6: Entering ratings for a new user ===============
%  Before we will train the collaborative filtering model, we will first
%  add ratings that correspond to a new user that we just observed. This
%  part of the code will also allow you to put in your own ratings for the
%  movies in our dataset!
%
movieList = loadMovieList();%  Initialize my ratings
my_ratings = zeros(1682, 1);% Check the file movie_idx.txt for id of each movie in our dataset
% For example, Toy Story (1995) has ID 1, so to rate it "4", you can set
my_ratings(1) = 4;% Or suppose did not enjoy Silence of the Lambs (1991), you can set
my_ratings(98) = 2;% We have selected a few movies we liked / did not like and the ratings we
% gave are as follows:
my_ratings(7) = 3;
my_ratings(12)= 10;
my_ratings(54) = 4;
my_ratings(64)= 10;
my_ratings(66)= 3;
my_ratings(69) = 10;
my_ratings(183) = 4;
my_ratings(226) = 10;
my_ratings(355)= 10;fprintf('\n\nNew user ratings:\n');
for i = 1:length(my_ratings)if my_ratings(i) > 0 fprintf('Rated %d for %s\n', my_ratings(i), ...movieList{i});end
endfprintf('\nProgram paused. Press enter to continue.\n');
pause;

其中LoadmovieList()导入了如下的电影(其实是我选了几个,另外几个随便选的)

New user ratings:
Rated 4 for Toy Story (1995)
Rated 3 for Twelve Monkeys (1995)
Rated 10 for Usual Suspects, The (1995)
Rated 4 for Outbreak (1995)
Rated 10 for Shawshank Redemption, The (1994)
Rated 3 for While You Were Sleeping (1995)
Rated 10 for Forrest Gump (1994)
Rated 2 for Silence of the Lambs, The (1991)
Rated 4 for Alien (1979)
Rated 10 for Die Hard 2 (1990)
Rated 10 for Sphere (1998)

现在开始训练参数了:

%% ================== Part 7: Learning Movie Ratings ====================
%  Now, you will train the collaborative filtering model on a movie rating 
%  dataset of 1682 movies and 943 users
%fprintf('\nTraining collaborative filtering...\n');%  Load data
load('ex8_movies.mat');%  Y is a 1682x943 matrix, containing ratings (1-5) of 1682 movies by 
%  943 users
%
%  R is a 1682x943 matrix, where R(i,j) = 1 if and only if user j gave a
%  rating to movie i%  Add our own ratings to the data matrix
Y = [my_ratings Y];
R = [(my_ratings ~= 0) R];%  Normalize Ratings
[Ynorm, Ymean] = normalizeRatings(Y, R);%  Useful Values
num_users = size(Y, 2);
num_movies = size(Y, 1);
num_features = 10;% Set Initial Parameters (Theta, X)
X = randn(num_movies, num_features);
Theta = randn(num_users, num_features);initial_parameters = [X(:); Theta(:)];% Set options for fmincg
options = optimset('GradObj', 'on', 'MaxIter', 100);% Set Regularization
lambda = 10;
theta = fmincg (@(t)(cofiCostFunc(t, Ynorm, R, num_users, num_movies, ...num_features, lambda)), ...initial_parameters, options);% Unfold the returned theta back into U and W
X = reshape(theta(1:num_movies*num_features), num_movies, num_features);
Theta = reshape(theta(num_movies*num_features+1:end), ...num_users, num_features);fprintf('Recommender system learning completed.\n');fprintf('\nProgram paused. Press enter to continue.\n');
pause;

然后,开始推荐:

%% ================== Part 8: Recommendation for you ====================
%  After training the model, you can now make recommendations by computing
%  the predictions matrix.
%p = X * Theta';
my_predictions = p(:,1) + Ymean;movieList = loadMovieList();[r, ix] = sort(my_predictions, 'descend');
fprintf('\nTop recommendations for you:\n');
for i=1:10j = ix(i);fprintf('Predicting rating %.1f for movie %s\n', my_predictions(j), ...movieList{j});
endfprintf('\n\nOriginal ratings provided:\n');
for i = 1:length(my_ratings)if my_ratings(i) > 0 fprintf('Rated %d for %s\n', my_ratings(i), ...movieList{i});end
end

结果推荐了这几部电影:

Top recommendations for you:
Predicting rating 6.5 for movie Forrest Gump (1994)
Predicting rating 6.3 for movie Return of the Jedi (1983)
Predicting rating 6.3 for movie Star Wars (1977)
Predicting rating 6.2 for movie Raiders of the Lost Ark (1981)
Predicting rating 6.1 for movie Shawshank Redemption, The (1994)
Predicting rating 6.1 for movie Empire Strikes Back, The (1980)
Predicting rating 6.0 for movie Braveheart (1995)
Predicting rating 6.0 for movie Titanic (1997)
Predicting rating 5.8 for movie Back to the Future (1985)
Predicting rating 5.8 for movie Game, The (1997)

好吧,我也没看过,都是很老的电影。。。我也不知道推荐的准不准。。。

这篇关于octave实现协同过滤推荐算法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/934663

相关文章

python生成随机唯一id的几种实现方法

《python生成随机唯一id的几种实现方法》在Python中生成随机唯一ID有多种方法,根据不同的需求场景可以选择最适合的方案,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习... 目录方法 1:使用 UUID 模块(推荐)方法 2:使用 Secrets 模块(安全敏感场景)方法

Spring StateMachine实现状态机使用示例详解

《SpringStateMachine实现状态机使用示例详解》本文介绍SpringStateMachine实现状态机的步骤,包括依赖导入、枚举定义、状态转移规则配置、上下文管理及服务调用示例,重点解... 目录什么是状态机使用示例什么是状态机状态机是计算机科学中的​​核心建模工具​​,用于描述对象在其生命

Spring Boot 结合 WxJava 实现文章上传微信公众号草稿箱与群发

《SpringBoot结合WxJava实现文章上传微信公众号草稿箱与群发》本文将详细介绍如何使用SpringBoot框架结合WxJava开发工具包,实现文章上传到微信公众号草稿箱以及群发功能,... 目录一、项目环境准备1.1 开发环境1.2 微信公众号准备二、Spring Boot 项目搭建2.1 创建

IntelliJ IDEA2025创建SpringBoot项目的实现步骤

《IntelliJIDEA2025创建SpringBoot项目的实现步骤》本文主要介绍了IntelliJIDEA2025创建SpringBoot项目的实现步骤,文中通过示例代码介绍的非常详细,对大家... 目录一、创建 Spring Boot 项目1. 新建项目2. 基础配置3. 选择依赖4. 生成项目5.

Linux下删除乱码文件和目录的实现方式

《Linux下删除乱码文件和目录的实现方式》:本文主要介绍Linux下删除乱码文件和目录的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux下删除乱码文件和目录方法1方法2总结Linux下删除乱码文件和目录方法1使用ls -i命令找到文件或目录

Spring Boot spring-boot-maven-plugin 参数配置详解(最新推荐)

《SpringBootspring-boot-maven-plugin参数配置详解(最新推荐)》文章介绍了SpringBootMaven插件的5个核心目标(repackage、run、start... 目录一 spring-boot-maven-plugin 插件的5个Goals二 应用场景1 重新打包应用

SpringBoot+EasyExcel实现自定义复杂样式导入导出

《SpringBoot+EasyExcel实现自定义复杂样式导入导出》这篇文章主要为大家详细介绍了SpringBoot如何结果EasyExcel实现自定义复杂样式导入导出功能,文中的示例代码讲解详细,... 目录安装处理自定义导出复杂场景1、列不固定,动态列2、动态下拉3、自定义锁定行/列,添加密码4、合并

mybatis执行insert返回id实现详解

《mybatis执行insert返回id实现详解》MyBatis插入操作默认返回受影响行数,需通过useGeneratedKeys+keyProperty或selectKey获取主键ID,确保主键为自... 目录 两种方式获取自增 ID:1. ​​useGeneratedKeys+keyProperty(推

Spring Boot集成Druid实现数据源管理与监控的详细步骤

《SpringBoot集成Druid实现数据源管理与监控的详细步骤》本文介绍如何在SpringBoot项目中集成Druid数据库连接池,包括环境搭建、Maven依赖配置、SpringBoot配置文件... 目录1. 引言1.1 环境准备1.2 Druid介绍2. 配置Druid连接池3. 查看Druid监控

Linux在线解压jar包的实现方式

《Linux在线解压jar包的实现方式》:本文主要介绍Linux在线解压jar包的实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录linux在线解压jar包解压 jar包的步骤总结Linux在线解压jar包在 Centos 中解压 jar 包可以使用 u