PageRank迭代求解方法

2023-12-06 13:32
文章标签 方法 迭代 求解 pagerank

本文主要是介绍PageRank迭代求解方法,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

PageRank算法迭代求解第二版程序

/*
描述: 小型Web超链图的PageRank算法迭代求解
作者: xiaocui
时间: 2008.4.19
版本: v1.0
*/

/*简单的PageRank算法为 PR(T) = PR(T1)/C(T1)+...+PR(Tn)/C(Tn)),
最后写成了 P = M * P, P为n个网页的pagerank值组成的列向量,
M为马尔可夫转移矩阵,其每列元素表示该网页跳转到其他网页的概率。
PageRank算法的求解就是求M矩阵特征值为1的特征向量,1是M的最大特
征值,可以通过幂法进行迭代求解。

本程序是模拟PageRank算法的迭代计算,只用了7个网页,其链接关系图用邻接矩阵
表示为:
      1    2  3  4  5  6  7
  1  0    1  1  1  1  0 1

  2  1    0  0  0  0  0  0

  3  1    1  0  0  0  0  0

  4  0    1  1  0  1  0  0

  5  1    0  1  1  0  1  0

  6  1    0  0  0  1  0  0

  7  0    0  0  0  1  0  0

转置归一化后对应的马尔可夫转移矩阵为:
      1     2    3      4       5       6      7
  1  0     1    0.5    0       0.25    0.5    0

  2  0.2  0    0.5    1/3     0       0      0

  3  0.2  0    0      1/3     0.25    0      0

  4  0.2  0    0      0       0.25    0      0

  5  0.2  0    0      1/3     0       0.5    1

  6  0     0    0      0       0.25    0      0

  7  0.2  0    0      0       0       0      0
*/
#include <iostream>
#include <vector>
#include <cmath>
using namespace std;

/* 计算矩阵和向量的乘积
输入:arr表示矩阵,vec表示向量
输出:结果向量
*/
vector<double> arrayVecMul(const vector<vector<double> >& arr, const vector<double>& vec)
{
vector<double> rstVec; //结果向量
double sum = 0.0;
for (size_t i = 0; i < arr.size(); ++i)
{
   sum = 0.0;
   for (size_t j = 0; j < arr[i].size(); ++j)
   {
    sum += arr[i][j] * vec[j];
   }
   rstVec.push_back(sum);
}

return rstVec;
}

/* 向量归1化
输入:vec表示向量
输出:归1化的向量vec
*/
void toOne(vector<double>& vec)
{
double sum = 0.0;
for (size_t i = 0; i < vec.size(); ++i)
{
   sum += vec[i];
}
for (size_t i = 0; i < vec.size(); ++i)
{
   vec[i] /= sum;
}
}

/* 返回向量的最大元素(绝对值最大)
输入:vec为向量
输出:最大元素值
*/
double getMaxElement(const vector<double>& vec)
{
double max = fabs(vec[0]);
for (size_t i = 0; i < vec.size(); ++i)
{
   double tmp = fabs(vec[i]);
   if ( tmp > max )
   {
    max = tmp;
   }
}

return max;
}

/* 判断误差是否满足,误差满足后迭代结束
输入:向量vecPrior表示前一次的结果,向量vec表示本次结果,e表示误差界
输出:true表示误差满足,迭代结束;false表示误差不满足
*/
bool isFinish(const vector<double>& vecPrior, const vector<double>& vec, double e)
{
double maxE = 0.0; //表示前后两个向量对应分量的最大误差
for (size_t i = 0; i < vecPrior.size(); ++i)
{
   double tmp = fabs(vec[i] - vecPrior[i]);
   if ( tmp > maxE )
   {
    maxE = tmp;
   }
}
if ( maxE < e )
{
   return true;
}

return false;
}

int main()
{
//构造马尔可夫转移矩阵
vector<vector<double> > arr;
double a1[7] = {0, 1, 0.5, 0, 0.25, 0.5, 0};
double a2[7] = {0.2, 0, 0.5, 1.0/3, 0, 0, 0};
double a3[7] = {0.2, 0, 0, 1.0/3, 0.25, 0, 0};
double a4[7] = {0.2, 0, 0, 0, 0.25, 0, 0};
double a5[7] = {0.2, 0, 0, 1.0/3, 0, 0.5, 1};
double a6[7] = {0, 0, 0, 0, 0.25, 0, 0};
double a7[7] = {0.2, 0, 0, 0, 0, 0, 0};
vector<double> row1(a1, a1 + 7);
vector<double> row2(a2, a2 + 7);
     vector<double> row3(a3, a3 + 7);
vector<double> row4(a4, a4 + 7);
vector<double> row5(a5, a5 + 7);
vector<double> row6(a6, a6 + 7);
vector<double> row7(a7, a7 + 7);
arr.push_back(row1);
arr.push_back(row2);
arr.push_back(row3);
arr.push_back(row4);
arr.push_back(row5);
arr.push_back(row6);
arr.push_back(row7);

double f[7] = {0, 0.8, 1, 0.3, 0.2, 0.7, 0.4};
vector<double> vec(f, f + 7); //初始向量
double e = 0.000001; //误差界
int count = 0; //迭代计算次数
vector<double> rstVec; //特征向量
double maxValue; //最大特征值

while ( 1 )
{
   count++;
   rstVec = arrayVecMul(arr, vec);
   maxValue = getMaxElement(rstVec);
   for (size_t i = 0; i < rstVec.size(); ++i)
   {
    vec[i] = rstVec[i] / maxValue;
   }
  
   if ( isFinish(vec, rstVec, e) )
   {
    break;
   }
   else
   {
    maxValue = getMaxElement(rstVec);
    for (size_t i = 0; i < rstVec.size(); ++i)
    {
     vec[i] = rstVec[i] / maxValue;
    }
   }
}

cout << "总共迭代了: " << count << "次" << endl;
cout << "最大特征值为: " << maxValue << endl;
for (size_t i = 0; i < rstVec.size(); ++i)
{
   cout << rstVec[i] << "  ";
}
cout << endl;

cout << "正确性检验: " << endl;
cout << "矩阵和特征向量的乘积: " << endl;
rstVec = arrayVecMul(arr, rstVec);
for (size_t i = 0; i < rstVec.size(); ++i)
{
   cout << rstVec[i] << "  ";
}
cout << endl;

cout << "特征值和特征向量的乘积: " << endl;
for (size_t i = 0; i < rstVec.size(); ++i)
{
   rstVec[i] = maxValue * rstVec[i];
}

return 0;
}

这篇关于PageRank迭代求解方法的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/461999

相关文章

Python中提取文件名扩展名的多种方法实现

《Python中提取文件名扩展名的多种方法实现》在Python编程中,经常会遇到需要从文件名中提取扩展名的场景,Python提供了多种方法来实现这一功能,不同方法适用于不同的场景和需求,包括os.pa... 目录技术背景实现步骤方法一:使用os.path.splitext方法二:使用pathlib模块方法三

Python打印对象所有属性和值的方法小结

《Python打印对象所有属性和值的方法小结》在Python开发过程中,调试代码时经常需要查看对象的当前状态,也就是对象的所有属性和对应的值,然而,Python并没有像PHP的print_r那样直接提... 目录python中打印对象所有属性和值的方法实现步骤1. 使用vars()和pprint()2. 使

CSS实现元素撑满剩余空间的五种方法

《CSS实现元素撑满剩余空间的五种方法》在日常开发中,我们经常需要让某个元素占据容器的剩余空间,本文将介绍5种不同的方法来实现这个需求,并分析各种方法的优缺点,感兴趣的朋友一起看看吧... css实现元素撑满剩余空间的5种方法 在日常开发中,我们经常需要让某个元素占据容器的剩余空间。这是一个常见的布局需求

Python常用命令提示符使用方法详解

《Python常用命令提示符使用方法详解》在学习python的过程中,我们需要用到命令提示符(CMD)进行环境的配置,:本文主要介绍Python常用命令提示符使用方法的相关资料,文中通过代码介绍的... 目录一、python环境基础命令【Windows】1、检查Python是否安装2、 查看Python的安

Maven 配置中的 <mirror>绕过 HTTP 阻断机制的方法

《Maven配置中的<mirror>绕过HTTP阻断机制的方法》:本文主要介绍Maven配置中的<mirror>绕过HTTP阻断机制的方法,本文给大家分享问题原因及解决方案,感兴趣的朋友一... 目录一、问题场景:升级 Maven 后构建失败二、解决方案:通过 <mirror> 配置覆盖默认行为1. 配置示

SpringBoot排查和解决JSON解析错误(400 Bad Request)的方法

《SpringBoot排查和解决JSON解析错误(400BadRequest)的方法》在开发SpringBootRESTfulAPI时,客户端与服务端的数据交互通常使用JSON格式,然而,JSON... 目录问题背景1. 问题描述2. 错误分析解决方案1. 手动重新输入jsON2. 使用工具清理JSON3.

使用jenv工具管理多个JDK版本的方法步骤

《使用jenv工具管理多个JDK版本的方法步骤》jenv是一个开源的Java环境管理工具,旨在帮助开发者在同一台机器上轻松管理和切换多个Java版本,:本文主要介绍使用jenv工具管理多个JD... 目录一、jenv到底是干啥的?二、jenv的核心功能(一)管理多个Java版本(二)支持插件扩展(三)环境隔

Java中Map.Entry()含义及方法使用代码

《Java中Map.Entry()含义及方法使用代码》:本文主要介绍Java中Map.Entry()含义及方法使用的相关资料,Map.Entry是Java中Map的静态内部接口,用于表示键值对,其... 目录前言 Map.Entry作用核心方法常见使用场景1. 遍历 Map 的所有键值对2. 直接修改 Ma

Mybatis Plus Join使用方法示例详解

《MybatisPlusJoin使用方法示例详解》:本文主要介绍MybatisPlusJoin使用方法示例详解,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,... 目录1、pom文件2、yaml配置文件3、分页插件4、示例代码:5、测试代码6、和PageHelper结合6

Java中实现线程的创建和启动的方法

《Java中实现线程的创建和启动的方法》在Java中,实现线程的创建和启动是两个不同但紧密相关的概念,理解为什么要启动线程(调用start()方法)而非直接调用run()方法,是掌握多线程编程的关键,... 目录1. 线程的生命周期2. start() vs run() 的本质区别3. 为什么必须通过 st