DeepMind关系推理网络

2024-05-07 14:32
文章标签 关系 网络 推理 deepmind

本文主要是介绍DeepMind关系推理网络,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

简介

本文用一个普适的关系网络RNs(Relation Networks)来解决“关系推理”(relational reasoning)问题。其使用的模型结构简单,效果远胜已有算法,甚至超出人类表现

论文于2017年6月5日在arxiv发布。由于其原理简明,爱好者们很快给出了pytorch实现、keras实现以及tensorflow实现。

关系推理问题

关系推理问题由三部分组成。

  1. 一系列事实,即推理的素材。可以是:

    • 一张图片:红色的球,黄色的圆柱,蓝色的立方体。
    • 一组场景信息:每个物体的类别,颜色,尺寸,位置。
    • 几个句子:Mike拿着足球。Mike去了办公室。
    • 一段数据:几个球在物理系统中弹跳,其中某几个有隐形杆相连。给出这些球的实时位置。
  2. 一个问题,作为推理的提示。由于强调关系,这些问题都涉及不止一个对象。例如:

    • 红色和黄色物体是否为同一类?
    • 哪个物体离蓝色球最远?
    • 足球在哪里?
    • 那些物体在运动时是相连的?
  3. 一个回答,即推理的结果。例如:

    • (红色和黄色物体)是(同一类)。
    • 黄圆柱。
    • (足球在)办公室。
    • A球和B球(是相连的)。

在训练集中,每组数据包含1.2.3;在测试集中,每组数据包含1.2, 要求回答出3。
说明:问题和回答不局限于自然语言。也可能使用结构化数据表示。

网络结构

系统

推理网络可以用下图表述。
这里写图片描述

事实O

问题Q都经过不同的embedding网络提取特征变为o,q

。这l两者构成系统的processing部分。

对于不同类别的输入,embedding可能是CNN(图像)或LSTM(自然语言)。

两个特征送入reasoning部分,推理出回答a

传统的推理网络中,reasoning部分可能是MLP,LSTM,或者带有attention的LSTM。

关系网络RN

本文使用关系网络(Relational Network)实现reasoning部分。
这里写图片描述

其理念非常直观
- 把事实特征分解成一系列对象o={o1,o2...on}


- 把对象两两配对,和问题特征q组成三元组
- 将三元组送入一个统一的MLP网络g
- 得到的结果相加,再次送入一个MLP网络f,输出回答a

 

可以用一个公式表达:

a=f(∑g(oi,oj,q))

 

RN的这种结构明确地表达了关系推理的两个思想
1. 最终答案和成对的对象有关
2. 问题本身也会影响如何考察对象对

举例:如果问题中包含“多远”,则应该关注两个对象的距离;如果问题中包含“和…颜色相同”,则应该关注两个对象的颜色。

具体实现

本文的实验设置非常详尽,具体可参看附录部分。这里只概述几个例子,大致建立基本概念。

特征提取

图像

不同任务均使用CNN对图像进行编码。差别仅在于卷积层具体参数。

使用如下步骤获得对象oi


- 原始图像归一化尺寸
- 经过一个卷积层获得p×q×k的结果
- 再经过Batch Normalization层和ReLU
- 结果中每个像素位置的k维特征 + 该像素归一化位置 = k+2维oi

1

试验中k=24。

自然语言

首先每个单词经过特征提取网络转化为32位特征。
之后把句子经过LSTM转换成特征,LSTM的单元数为32,128或256。

对于由多个句子组成的事实,每个句子的特征+该句子在事实集合中位置 = 对象oi


对于问题,该问句的特征即为q

结构化数据

将每个物体的结构化数据(位置、颜色、尺寸、材质)直接作为对象特征。

RN网络

不同任务使用RN网络结构类似,以下举出一例。

g

:4层MLP,每层256个节点;ReLU激活。
f

:3层MLP,各层节点256-256-29;50%的drop-out;ReLU激活;softmax输出各种答案的概率。

结论

比起已有系统的特征提取部分(ResNet,VGG),本文的特征提取模型简单,却仍取得更好效果。这证明:

关系推理问题的难点在“推理”部分,而非信息处理部分。

对于非关系推理类问题,本文系统与已有系统表现类似;但在关系推理问题中,本文远远胜出。说明:

本文RN网络的成对结构是解决关系推理的关键。

作者在未来工作的展望中,希望把RN结构应用到更广泛的问题中,例如强化学习的复杂场景理解,社交网络建模,抽象问题求解等。还可以利用attention机制缩减对象对的规模,以节约资源。

这篇关于DeepMind关系推理网络的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/967620

相关文章

Linux网络配置之网桥和虚拟网络的配置指南

《Linux网络配置之网桥和虚拟网络的配置指南》这篇文章主要为大家详细介绍了Linux中配置网桥和虚拟网络的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 一、网桥的配置在linux系统中配置一个新的网桥主要涉及以下几个步骤:1.为yum仓库做准备,安装组件epel-re

python如何下载网络文件到本地指定文件夹

《python如何下载网络文件到本地指定文件夹》这篇文章主要为大家详细介绍了python如何实现下载网络文件到本地指定文件夹,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下...  在python中下载文件到本地指定文件夹可以通过以下步骤实现,使用requests库处理HTTP请求,并结合o

Linux高并发场景下的网络参数调优实战指南

《Linux高并发场景下的网络参数调优实战指南》在高并发网络服务场景中,Linux内核的默认网络参数往往无法满足需求,导致性能瓶颈、连接超时甚至服务崩溃,本文基于真实案例分析,从参数解读、问题诊断到优... 目录一、问题背景:当并发连接遇上性能瓶颈1.1 案例环境1.2 初始参数分析二、深度诊断:连接状态与

Qt实现网络数据解析的方法总结

《Qt实现网络数据解析的方法总结》在Qt中解析网络数据通常涉及接收原始字节流,并将其转换为有意义的应用层数据,这篇文章为大家介绍了详细步骤和示例,感兴趣的小伙伴可以了解下... 目录1. 网络数据接收2. 缓冲区管理(处理粘包/拆包)3. 常见数据格式解析3.1 jsON解析3.2 XML解析3.3 自定义

Linux系统配置NAT网络模式的详细步骤(附图文)

《Linux系统配置NAT网络模式的详细步骤(附图文)》本文详细指导如何在VMware环境下配置NAT网络模式,包括设置主机和虚拟机的IP地址、网关,以及针对Linux和Windows系统的具体步骤,... 目录一、配置NAT网络模式二、设置虚拟机交换机网关2.1 打开虚拟机2.2 管理员授权2.3 设置子

揭秘Python Socket网络编程的7种硬核用法

《揭秘PythonSocket网络编程的7种硬核用法》Socket不仅能做聊天室,还能干一大堆硬核操作,这篇文章就带大家看看Python网络编程的7种超实用玩法,感兴趣的小伙伴可以跟随小编一起... 目录1.端口扫描器:探测开放端口2.简易 HTTP 服务器:10 秒搭个网页3.局域网游戏:多人联机对战4.

Tomcat版本与Java版本的关系及说明

《Tomcat版本与Java版本的关系及说明》:本文主要介绍Tomcat版本与Java版本的关系及说明,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Tomcat版本与Java版本的关系Tomcat历史版本对应的Java版本Tomcat支持哪些版本的pythonJ

SpringBoot使用OkHttp完成高效网络请求详解

《SpringBoot使用OkHttp完成高效网络请求详解》OkHttp是一个高效的HTTP客户端,支持同步和异步请求,且具备自动处理cookie、缓存和连接池等高级功能,下面我们来看看SpringB... 目录一、OkHttp 简介二、在 Spring Boot 中集成 OkHttp三、封装 OkHttp

Linux系统之主机网络配置方式

《Linux系统之主机网络配置方式》:本文主要介绍Linux系统之主机网络配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、查看主机的网络参数1、查看主机名2、查看IP地址3、查看网关4、查看DNS二、配置网卡1、修改网卡配置文件2、nmcli工具【通用

使用Python高效获取网络数据的操作指南

《使用Python高效获取网络数据的操作指南》网络爬虫是一种自动化程序,用于访问和提取网站上的数据,Python是进行网络爬虫开发的理想语言,拥有丰富的库和工具,使得编写和维护爬虫变得简单高效,本文将... 目录网络爬虫的基本概念常用库介绍安装库Requests和BeautifulSoup爬虫开发发送请求解