inductive learning 与 transductive learning在图神经网络上的区别

2023-11-01 12:32

本文主要是介绍inductive learning 与 transductive learning在图神经网络上的区别,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

监督学习与非监督学习

监督学习

简单解释:
监督学习就是要在一组有标签信息的数据中训练一个模型,然后将该模型应用于一组测试数据上分析模型的泛化误差。
监督学习会把数据分成训练集和测试集,监督学习方法的重要假设是数据的分布是独立同分布的。监督学习要在训练数据中归纳出一个一般规则然后应用于测试数据中。训练数据是有标签的,测试数据是没有标签的。
百度百科解释

非监督学习,

简单解释:
非监督学习是在数据中无标记信息或者数据集中存在大量数据没有标签的情况下,使用某种规则或策略对数据进行分析归纳出数据的分布。比如,聚类。非监督的重点在于没有标记信息作为指导。非监督方法的数据假设参与训练的数据是独立同分布的。
百度百科解释

自监督

在绝大多数场景中,有标签的数据是非常稀少的,并且数据标记的代价非常巨大。非监督的学习方式在同等数量级上效果远不及监督学习,因此,从数据中寻找监督信息便吸引了很多研究者的注意力。自监督学习的主要方法是通过设计辅助任务(proxy tasks)从数据中寻找监督信息。需要注意的是这里的监督信息不是原始数据中的标签信息而是辅助任务设计的监督信息。比较常见的自监督应用就是预训练模型,比如bert中会mask掉一个句子中的部分单词,被mask的单词就可以作为监督信息,任务会预测被mask掉的是啥。

半监督

半监督介于监督学习和无监督之间。训练集中只有部分数据有标签,需要通过伪标签生成等方式完成模型训练。半监督学习的基本思想是利用数据分布上的模型假设建立学习器对未标签样例进行标记扩充标记数据集并不断训练学习器期望学习器能对原有标记数据准确预测。X={{S,Y},U},S为有标记的数据,Y为S的标签,U为没有标记的数据,期望训练得到f对于X能准确预测Y。百度百科

半监督学习(Semi-SupervisedLearning,SSL)按照统计学习理论的角度包括直推(Transductive)SSL和归纳(Inductive)SSL两类模式。
1. 直推SSL利用训练数据中有标签的样本和无标签的样例进行训练,预测训练数据中无标签的样例的类标签。该方法只处理样本空间内给定的训练数据即对训练时未见过的数据不予预测(没有测试数据集了)
2. 归纳SSL参与训练的数据包括训练数据中有类标签的样本和无类标签的样例,以及未知的测试样例。归纳式不仅预测训练数据中无类标签的样例的类标签,更主要的是预测未知的测试样例的类标签。该方法处理整个样本空间中所有给定和未知的样例即训练时使用到的数据和没有见过的数据。
二者主要的差别在于涉及到的数据,inductive会对未知的样本做预测即不在训练数据中的样本。

inductive learning 与 transductive learning

inductive learning

inductive semi-supervised learning与监督学习方法类似,基于已有的标记训练数据集构建和训练机器学习模型。 然后,我们使用这个训练过的模型来预测从未遇到过的测试数据集的标签。

transductive learning

直推式学习技术已经预先观察了所有数据。 我们从已经观察到的训练数据集中学习,然后预测训练数据集中未标记数据的标签。 即使我们不知道数据的标签,我们也可以在学习过程中利用这些数据中存在的模式和其他信息。 如果将新的数据点添加到数据集中,那么我们将必须从头开始重新运行算法,训练模型,然后使用它来预测标签。 另一方面,归纳学习建立了预测模型。 当您遇到新的数据点时,无需从头开始重新运行算法。

inductive & transductive learning在图上的应用

由于在图数据上的学习需要考虑图的结构信息,在模型训练时需要将全图输入,所以训练时会使用到没有标记信息的数据信息,所以使用的是transductive方式,一旦图的结构发生变化,需要重新学习。
当图结构非常的时,内存可能无法全部放下数据,因此需要对图进行采样,如graphSage。那么采样到的数据就可以不包含没有标记的结点,因此可以使用inductive方式学习,这样模型就有一定的迁移能力,可以预测没有见过的结点。

标准的半监督要求数据满足独立同分布假设,但是在图数据中并不遵循该前提,所以,图机器学习任务不被认为是标准的机器学习任务。

参考

https://www.zhihu.com/question/68275921
https://www.cnblogs.com/chuanyang/p/13892321.html

这篇关于inductive learning 与 transductive learning在图神经网络上的区别的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/323008

相关文章

JAVA覆盖和重写的区别及说明

《JAVA覆盖和重写的区别及说明》非静态方法的覆盖即重写,具有多态性;静态方法无法被覆盖,但可被重写(仅通过类名调用),二者区别在于绑定时机与引用类型关联性... 目录Java覆盖和重写的区别经常听到两种话认真读完上面两份代码JAVA覆盖和重写的区别经常听到两种话1.覆盖=重写。2.静态方法可andro

C++中全局变量和局部变量的区别

《C++中全局变量和局部变量的区别》本文主要介绍了C++中全局变量和局部变量的区别,全局变量和局部变量在作用域和生命周期上有显著的区别,下面就来介绍一下,感兴趣的可以了解一下... 目录一、全局变量定义生命周期存储位置代码示例输出二、局部变量定义生命周期存储位置代码示例输出三、全局变量和局部变量的区别作用域

MyBatis中$与#的区别解析

《MyBatis中$与#的区别解析》文章浏览阅读314次,点赞4次,收藏6次。MyBatis使用#{}作为参数占位符时,会创建预处理语句(PreparedStatement),并将参数值作为预处理语句... 目录一、介绍二、sql注入风险实例一、介绍#(井号):MyBATis使用#{}作为参数占位符时,会

Android kotlin中 Channel 和 Flow 的区别和选择使用场景分析

《Androidkotlin中Channel和Flow的区别和选择使用场景分析》Kotlin协程中,Flow是冷数据流,按需触发,适合响应式数据处理;Channel是热数据流,持续发送,支持... 目录一、基本概念界定FlowChannel二、核心特性对比数据生产触发条件生产与消费的关系背压处理机制生命周期

Javaee多线程之进程和线程之间的区别和联系(最新整理)

《Javaee多线程之进程和线程之间的区别和联系(最新整理)》进程是资源分配单位,线程是调度执行单位,共享资源更高效,创建线程五种方式:继承Thread、Runnable接口、匿名类、lambda,r... 目录进程和线程进程线程进程和线程的区别创建线程的五种写法继承Thread,重写run实现Runnab

C++中NULL与nullptr的区别小结

《C++中NULL与nullptr的区别小结》本文介绍了C++编程中NULL与nullptr的区别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编... 目录C++98空值——NULLC++11空值——nullptr区别对比示例 C++98空值——NUL

Conda与Python venv虚拟环境的区别与使用方法详解

《Conda与Pythonvenv虚拟环境的区别与使用方法详解》随着Python社区的成长,虚拟环境的概念和技术也在不断发展,:本文主要介绍Conda与Pythonvenv虚拟环境的区别与使用... 目录前言一、Conda 与 python venv 的核心区别1. Conda 的特点2. Python v

Go语言中make和new的区别及说明

《Go语言中make和new的区别及说明》:本文主要介绍Go语言中make和new的区别及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1 概述2 new 函数2.1 功能2.2 语法2.3 初始化案例3 make 函数3.1 功能3.2 语法3.3 初始化

深度解析Spring Boot拦截器Interceptor与过滤器Filter的区别与实战指南

《深度解析SpringBoot拦截器Interceptor与过滤器Filter的区别与实战指南》本文深度解析SpringBoot中拦截器与过滤器的区别,涵盖执行顺序、依赖关系、异常处理等核心差异,并... 目录Spring Boot拦截器(Interceptor)与过滤器(Filter)深度解析:区别、实现

Before和BeforeClass的区别及说明

《Before和BeforeClass的区别及说明》:本文主要介绍Before和BeforeClass的区别及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Before和BeforeClass的区别一个简单的例子当运行这个测试类时总结Before和Befor