inductive learning 与 transductive learning在图神经网络上的区别

2023-11-01 12:32

本文主要是介绍inductive learning 与 transductive learning在图神经网络上的区别,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

监督学习与非监督学习

监督学习

简单解释:
监督学习就是要在一组有标签信息的数据中训练一个模型,然后将该模型应用于一组测试数据上分析模型的泛化误差。
监督学习会把数据分成训练集和测试集,监督学习方法的重要假设是数据的分布是独立同分布的。监督学习要在训练数据中归纳出一个一般规则然后应用于测试数据中。训练数据是有标签的,测试数据是没有标签的。
百度百科解释

非监督学习,

简单解释:
非监督学习是在数据中无标记信息或者数据集中存在大量数据没有标签的情况下,使用某种规则或策略对数据进行分析归纳出数据的分布。比如,聚类。非监督的重点在于没有标记信息作为指导。非监督方法的数据假设参与训练的数据是独立同分布的。
百度百科解释

自监督

在绝大多数场景中,有标签的数据是非常稀少的,并且数据标记的代价非常巨大。非监督的学习方式在同等数量级上效果远不及监督学习,因此,从数据中寻找监督信息便吸引了很多研究者的注意力。自监督学习的主要方法是通过设计辅助任务(proxy tasks)从数据中寻找监督信息。需要注意的是这里的监督信息不是原始数据中的标签信息而是辅助任务设计的监督信息。比较常见的自监督应用就是预训练模型,比如bert中会mask掉一个句子中的部分单词,被mask的单词就可以作为监督信息,任务会预测被mask掉的是啥。

半监督

半监督介于监督学习和无监督之间。训练集中只有部分数据有标签,需要通过伪标签生成等方式完成模型训练。半监督学习的基本思想是利用数据分布上的模型假设建立学习器对未标签样例进行标记扩充标记数据集并不断训练学习器期望学习器能对原有标记数据准确预测。X={{S,Y},U},S为有标记的数据,Y为S的标签,U为没有标记的数据,期望训练得到f对于X能准确预测Y。百度百科

半监督学习(Semi-SupervisedLearning,SSL)按照统计学习理论的角度包括直推(Transductive)SSL和归纳(Inductive)SSL两类模式。
1. 直推SSL利用训练数据中有标签的样本和无标签的样例进行训练,预测训练数据中无标签的样例的类标签。该方法只处理样本空间内给定的训练数据即对训练时未见过的数据不予预测(没有测试数据集了)
2. 归纳SSL参与训练的数据包括训练数据中有类标签的样本和无类标签的样例,以及未知的测试样例。归纳式不仅预测训练数据中无类标签的样例的类标签,更主要的是预测未知的测试样例的类标签。该方法处理整个样本空间中所有给定和未知的样例即训练时使用到的数据和没有见过的数据。
二者主要的差别在于涉及到的数据,inductive会对未知的样本做预测即不在训练数据中的样本。

inductive learning 与 transductive learning

inductive learning

inductive semi-supervised learning与监督学习方法类似,基于已有的标记训练数据集构建和训练机器学习模型。 然后,我们使用这个训练过的模型来预测从未遇到过的测试数据集的标签。

transductive learning

直推式学习技术已经预先观察了所有数据。 我们从已经观察到的训练数据集中学习,然后预测训练数据集中未标记数据的标签。 即使我们不知道数据的标签,我们也可以在学习过程中利用这些数据中存在的模式和其他信息。 如果将新的数据点添加到数据集中,那么我们将必须从头开始重新运行算法,训练模型,然后使用它来预测标签。 另一方面,归纳学习建立了预测模型。 当您遇到新的数据点时,无需从头开始重新运行算法。

inductive & transductive learning在图上的应用

由于在图数据上的学习需要考虑图的结构信息,在模型训练时需要将全图输入,所以训练时会使用到没有标记信息的数据信息,所以使用的是transductive方式,一旦图的结构发生变化,需要重新学习。
当图结构非常的时,内存可能无法全部放下数据,因此需要对图进行采样,如graphSage。那么采样到的数据就可以不包含没有标记的结点,因此可以使用inductive方式学习,这样模型就有一定的迁移能力,可以预测没有见过的结点。

标准的半监督要求数据满足独立同分布假设,但是在图数据中并不遵循该前提,所以,图机器学习任务不被认为是标准的机器学习任务。

参考

https://www.zhihu.com/question/68275921
https://www.cnblogs.com/chuanyang/p/13892321.html

这篇关于inductive learning 与 transductive learning在图神经网络上的区别的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/323008

相关文章

MySQL中VARCHAR和TEXT的区别小结

《MySQL中VARCHAR和TEXT的区别小结》MySQL中VARCHAR和TEXT用于存储字符串,VARCHAR可变长度存储在行内,适合短文本;TEXT存储在溢出页,适合大文本,下面就来具体的了解... 目录一、VARCHAR 和 TEXT 基本介绍1. VARCHAR2. TEXT二、VARCHAR

python中getsizeof和asizeof的区别小结

《python中getsizeof和asizeof的区别小结》本文详细的介绍了getsizeof和asizeof的区别,这两个函数都用于获取对象的内存占用大小,它们来自不同的库,下面就来详细的介绍一下... 目录sys.getsizeof (python 内置)pympler.asizeof.asizeof

Vue和React受控组件的区别小结

《Vue和React受控组件的区别小结》本文主要介绍了Vue和React受控组件的区别小结,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学... 目录背景React 的实现vue3 的实现写法一:直接修改事件参数写法二:通过ref引用 DOMVu

Go之errors.New和fmt.Errorf 的区别小结

《Go之errors.New和fmt.Errorf的区别小结》本文主要介绍了Go之errors.New和fmt.Errorf的区别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考... 目录error的基本用法1. 获取错误信息2. 在条件判断中使用基本区别1.函数签名2.使用场景详细对

Redis中哨兵机制和集群的区别及说明

《Redis中哨兵机制和集群的区别及说明》Redis哨兵通过主从复制实现高可用,适用于中小规模数据;集群采用分布式分片,支持动态扩展,适合大规模数据,哨兵管理简单但扩展性弱,集群性能更强但架构复杂,根... 目录一、架构设计与节点角色1. 哨兵机制(Sentinel)2. 集群(Cluster)二、数据分片

一文带你迅速搞懂路由器/交换机/光猫三者概念区别

《一文带你迅速搞懂路由器/交换机/光猫三者概念区别》讨论网络设备时,常提及路由器、交换机及光猫等词汇,日常生活、工作中,这些设备至关重要,居家上网、企业内部沟通乃至互联网冲浪皆无法脱离其影响力,本文将... 当谈论网络设备时,我们常常会听到路由器、交换机和光猫这几个名词。它们是构建现代网络基础设施的关键组成

redis和redission分布式锁原理及区别说明

《redis和redission分布式锁原理及区别说明》文章对比了synchronized、乐观锁、Redis分布式锁及Redission锁的原理与区别,指出在集群环境下synchronized失效,... 目录Redis和redission分布式锁原理及区别1、有的同伴想到了synchronized关键字

JAVA覆盖和重写的区别及说明

《JAVA覆盖和重写的区别及说明》非静态方法的覆盖即重写,具有多态性;静态方法无法被覆盖,但可被重写(仅通过类名调用),二者区别在于绑定时机与引用类型关联性... 目录Java覆盖和重写的区别经常听到两种话认真读完上面两份代码JAVA覆盖和重写的区别经常听到两种话1.覆盖=重写。2.静态方法可andro

C++中全局变量和局部变量的区别

《C++中全局变量和局部变量的区别》本文主要介绍了C++中全局变量和局部变量的区别,全局变量和局部变量在作用域和生命周期上有显著的区别,下面就来介绍一下,感兴趣的可以了解一下... 目录一、全局变量定义生命周期存储位置代码示例输出二、局部变量定义生命周期存储位置代码示例输出三、全局变量和局部变量的区别作用域

MyBatis中$与#的区别解析

《MyBatis中$与#的区别解析》文章浏览阅读314次,点赞4次,收藏6次。MyBatis使用#{}作为参数占位符时,会创建预处理语句(PreparedStatement),并将参数值作为预处理语句... 目录一、介绍二、sql注入风险实例一、介绍#(井号):MyBATis使用#{}作为参数占位符时,会