涨点神器!全局注意力+位置注意力,打造更强深度学习模型

本文主要是介绍涨点神器!全局注意力+位置注意力,打造更强深度学习模型,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

全局注意力结合位置注意力是学术界与工业界共同的研究热点,它可以有效提升深度学习模型的性能,助力涨点。

这种结合策略充分利用全局注意力(擅长捕捉序列或图像中的长距离依赖)和位置注意力(专注于序列中元素的具体位置)各自的优势,让模型在处理数据时同时考虑元素的内容及其在序列中的位置。这不仅提高了模型的表达能力,还能在保持计算效率的同时增强模型对复杂模式的理解和预测能力。

比如全局位置自注意力网络GPS-Net,通过空间自注意力学习结构化依赖性,并通过通道自注意力捕捉全局有序的语义和位置依赖性,在多个识别任务中超越了SOTA方法。

本文分享全局注意力+位置注意力8种创新结合方案,可借鉴的方法和创新点我做了简单介绍,已经开源的代码都整理了,方便同学们学习。

论文原文以及开源代码需要的同学看文末

Global Positional Self-Attention for Skeleton-Based Action Recognition

方法:论文介绍了一种新颖的全局位置自注意力网络(GPS-Net),可以表示基于骨骼的动作识别中的空间结构依赖和全局有序的语义信息。通过空间自注意和通道自注意,结构依赖和全局有序的语义和位置依赖可以捕获到。

创新点:

  • 引入了一种新颖的全局位置自注意网络,通过空间自注意和通道自注意两个模块来捕捉骨骼动作识别中的空间结构依赖和全局语义信息。这种网络结构简单而有效,能够准确地进行动作预测。

  • 提出了一种新的结构位置编码方法。通过定义一组基于测地距离的结构位置,将身体关节分成多个部分,并使用同一结构位置编码来编码每个部分的关节。这种编码方法能够反映身体的结构特征,并提高动作识别的性能。

Global Self-Attention Networks for Image Recognition

方法:论文中提出了一种新的全局自注意力模块GSA,它同时考虑了像素的内容和空间位置。这个模块包含两个并行的层次:内容注意力层:这一层基于像素的内容进行注意力的分配。位置注意力层:这一层根据像素的空间位置进行注意力的分配。

创新点:

  • 提出了一种新的全局自注意力模块,称为GSA模块,该模块同时考虑像素的内容和空间位置。该模块由并行的内容注意力分支和位置注意力分支组成,最后将它们的输出相加。相比于传统的空间卷积,该GSA模块具有更高的效率,并可以作为深度网络的主要组件。

  • 基于GSA模块提出了GSA网络,用GSA模块代替空间卷积来建模像素间的长距离相互作用。相比于使用卷积的网络,GSA网络在CIFAR-100和ImageNet数据集上取得了显著的性能提升,且使用的参数和计算量更少。

Combining Global and Local Attention with Positional Encoding for Video Summarization

方法:论文提出了一种新的监督视频摘要方法,该方法结合了全局和局部多头注意力机制,以在不同粒度级别发现帧依赖性的不同建模方式。此外,所使用的注意力机制还整合了一个编码视频帧时间位置的组件,这在生成视频摘要时非常重要。

创新点:

  • PGL-SUM模型采用了全局和局部多头注意力机制,以不同的粒度发现视频帧的依赖关系,进而提高视频摘要的性能。

  • PGL-SUM模型引入了绝对位置编码组件,用于编码视频帧的时间顺序,提高了视频摘要的时序连贯性。

  • 在SumMe数据集上的实验证明了PGL-SUM模型相对于现有注意力机制的有效性,并与其他最先进的有监督摘要方法竞争性能。

TransXNet: Learning Both Global and Local Dynamics with a Dual Dynamic Token Mixer for Visual Recognition

方法:本研究提出了一种高效的双动态令牌混合器(D-Mixer),利用重叠空间降维注意力(OSRA)和输入相关的深度卷积(IDConv)提供的混合特征提取。通过将基于D-Mixer的块堆叠到深层网络中,使用前面块中收集的局部和全局信息动态生成IDConv中的卷积核和OSRA中的注意力矩阵,从而赋予网络更强的表示能力,融合强大的归纳偏差和扩展的有效感受野。

创新点:

  • 提出了一种高效的双动态令牌混合器(D-Mixer),利用重叠空间缩减注意力(OSRA)和输入依赖深度卷积(IDConv)提供的混合特征提取。通过将基于D-Mixer的块堆叠到深度网络中,利用先前块中收集的局部和全局信息动态生成IDConv中的卷积核和OSRA中的注意力矩阵,通过融合强归纳偏差和扩展有效感受野,使网络具备更强的表示能力。

  • 设计了一种名为TransXNet的新型混合CNN-Transformer网络,通过交替使用D-Mixer和MS-FFN构建。在各种视觉任务中,TransXNet展现出了领先的性能。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“全局位置”获取全部论文+代码

码字不易,欢迎大家点赞评论收藏

这篇关于涨点神器!全局注意力+位置注意力,打造更强深度学习模型的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1034831

相关文章

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程?1.2 为什么需要虚拟线程?二、虚拟线程与平台线程对比代码对比示例:三

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4

Linux五种IO模型的使用解读

《Linux五种IO模型的使用解读》文章系统解析了Linux的五种IO模型(阻塞、非阻塞、IO复用、信号驱动、异步),重点区分同步与异步IO的本质差异,强调同步由用户发起,异步由内核触发,通过对比各模... 目录1.IO模型简介2.五种IO模型2.1 IO模型分析方法2.2 阻塞IO2.3 非阻塞IO2.4

SpringBoot全局域名替换的实现

《SpringBoot全局域名替换的实现》本文主要介绍了SpringBoot全局域名替换的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一... 目录 项目结构⚙️ 配置文件application.yml️ 配置类AppProperties.Ja

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言:解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置

Python ORM神器之SQLAlchemy基本使用完全指南

《PythonORM神器之SQLAlchemy基本使用完全指南》SQLAlchemy是Python主流ORM框架,通过对象化方式简化数据库操作,支持多数据库,提供引擎、会话、模型等核心组件,实现事务... 目录一、什么是SQLAlchemy?二、安装SQLAlchemy三、核心概念1. Engine(引擎)