图表征模型研究

2024-03-20 00:30
文章标签 模型 研究 表征

本文主要是介绍图表征模型研究,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

图表征对于知识图谱是很重要的,如何将图进行embedding,并输入到深度学习模型中,是一个热点问题。

1. GraphSage模型

主要应用于同构图中,是一种归纳式的图表征模型,首先从一个图中训练出embedding方法,在图更新频率高,出现未知的节点时,能够基于邻居节点快速对未知节点进行embedding,而不必对全图进行重新训练。
源码:pytorch版:https://gitcode.com/mirrors/twjiang/graphsage-pytorch/tree/master
tensorflow版:https://github.com/williamleif/GraphSAGE
模型原理:1)先随机采样1层或2层邻居节点,通常k=2;2)从采样的最外层(一般是第2层)向内聚合,可以采用mean、max、lstm等聚合函数将邻居节点进行聚合,再将聚合后的邻局embedding与下一层的节点进行拼接concat,再通过激活函数得到下一层节点的embedding;3)重复步骤2,直到得到目标节点的embedding。
在这里插入图片描述
在这里插入图片描述

模型训练:

  • 无监督:假设节点的相似性与其距离呈正相关,邻近节点应当相似,不相邻节点应当不相似
  • 有监督:更换损失函数,例如交叉熵损失函数。

2. metapath2vec模型

可以用于异构图网络,先人为设计一些metapath(元路径),例如一个金融诈骗图中有人员person、手机号Tel、邮箱email,人为设计元路径:PTP,即2人共用一个号码,采样时从一个person出发,只会walk到邻接的tel上,再从tel走到下一个person上,不会随机乱走到其它类型的节点上。
得到节点的游走序列,再将序列输入到skip-gram中以得到每个节点的嵌入表示。
源码:https://github.com/PaddlePaddle/PGL/tree/main/examples/metapath2vec

3. 实践

此处以torch版graphsage为例,下载并解压源码。
模型的输入是:paper–>paper,关系是:引用,对于每个paper节点,采用其关键词的词袋(出现为1,不出现为0)生成每个paper的特征向量。(对于自己的数据集,需要考虑采用节点的什么属性生成每个节点的特征向量,这是很重要的一步。其中类型属性列可以采用one-hot编码)
模型训练过程源码的说明,此处为有监督训练。

# 模型参数,w和bias矩阵
model.parameters()
# 模型参数是否冻结,不更新w和bias矩阵
param.requires_grad
# 优化器,常用的有SGD、ADAM等
torch.optim.SGD(params, lr=0.7)
# 梯度置0,因为训练的过程通常使用mini-batch方法,所以如果不将梯度清零的话,梯度会与上一个batch的数据相关
optimizer.zero_grad()
# 反向传播,计算梯度
loss.backward()
# 梯度裁剪,缓解梯度爆炸的问题
nn.utils.clip_grad_norm_(model.parameters(), 5)
# 执行一次优化步骤,通过梯度下降法来更新w和bias矩阵
optimizer.step()
# 有监督训练时采用分类模型计算loss
logists = classification(embs_batch)
loss_sup = -torch.sum(logists[range(logists.size(0)), labels_batch], 0)
loss_sup /= len(nodes_batch)
loss = loss_sup
# 计算f1、acc、recall
vali_f1 = f1_score(labels_val, predicts.cpu().data)
vali_acc = accuracy_score(labels_val, predicts.cpu().data)
vali_recall = recall_score(labels_val, predicts.cpu().data)

执行main.py,开始训练,控制台会打印每个epoch的的训练过程,最后保存一个f1最高的torch模型结果在本地。
查看节点embedding。

# 加载模型,包含一个graphsage,一个classification
model = torch.load(model_file)
# 输入2个节点,获取其embedding
nodes = np.asarray([1, 3])
nodes_emb = model[0](nodes)
# 将embedding输入分类模型,获取分类结果
logists = model[1](embs_batch)
label_prob, label_predict = torch.max(logists , 1)

这篇关于图表征模型研究的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/827710

相关文章

详解如何使用Python从零开始构建文本统计模型

《详解如何使用Python从零开始构建文本统计模型》在自然语言处理领域,词汇表构建是文本预处理的关键环节,本文通过Python代码实践,演示如何从原始文本中提取多尺度特征,并通过动态调整机制构建更精确... 目录一、项目背景与核心思想二、核心代码解析1. 数据加载与预处理2. 多尺度字符统计3. 统计结果可

SpringBoot整合Sa-Token实现RBAC权限模型的过程解析

《SpringBoot整合Sa-Token实现RBAC权限模型的过程解析》:本文主要介绍SpringBoot整合Sa-Token实现RBAC权限模型的过程解析,本文给大家介绍的非常详细,对大家的学... 目录前言一、基础概念1.1 RBAC模型核心概念1.2 Sa-Token核心功能1.3 环境准备二、表结

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》:本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

SpringBoot快速接入OpenAI大模型的方法(JDK8)

《SpringBoot快速接入OpenAI大模型的方法(JDK8)》本文介绍了如何使用AI4J快速接入OpenAI大模型,并展示了如何实现流式与非流式的输出,以及对函数调用的使用,AI4J支持JDK8... 目录使用AI4J快速接入OpenAI大模型介绍AI4J-github快速使用创建SpringBoot

使用 sql-research-assistant进行 SQL 数据库研究的实战指南(代码实现演示)

《使用sql-research-assistant进行SQL数据库研究的实战指南(代码实现演示)》本文介绍了sql-research-assistant工具,该工具基于LangChain框架,集... 目录技术背景介绍核心原理解析代码实现演示安装和配置项目集成LangSmith 配置(可选)启动服务应用场景

0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型的操作流程

《0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeekR1模型的操作流程》DeepSeekR1模型凭借其强大的自然语言处理能力,在未来具有广阔的应用前景,有望在多个领域发... 目录0基础租个硬件玩deepseek,蓝耘元生代智算云|本地部署DeepSeek R1模型,3步搞定一个应

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll