注意力机制:点积、通用、缩放点积、拼接、相加

2023-12-28 06:32

本文主要是介绍注意力机制:点积、通用、缩放点积、拼接、相加,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

自 然 语 言 推 理 (Natural Language Inference,NLI)任务中相对应的 句子等。如果将下游任务抽象成查询(query),就可 以归纳出注意力机制的通用形式,即将源文本看成 是键-值对序列,用K=(k1,…,kN )V=(v1,…,vN )分 别表示键序列值序列,用 Q=(q1,…,qM)表示查询序列,那么针对查询的注意力可以被描述为键-值对序列在该查询上的映射 。如图2所示,计算过程可分为三步:

(1)计算查询 和每个键 的注意力得分,常 用的计算方法包括

点积[7] 、

缩放点积[6] 、

拼接[7] 以及

相加[3] 等,如公式(1)所示;

(2)使用 Softmax 等函数对注意力得分归一 化处理,得到每个键的权重,如公式(2)所示;

(3)将权重和其对应的值加权求和作为注 意力输出,如公式(3)所示。

其中,W 和 U 代表可学习的参数矩阵,v代表参数向量。 

 

键−值对是源文本的组成元素,可以是字符、词、 短语、句子等,甚至是它们的组合[8] 。这些元素一般 用向量表示,向量不仅是元素的内容表示,同时也是 元素的唯一标识,在通常情况下 K=V。模型输出的 注意力是源文本序列基于查询 qt的表示,不同的查 询会给源文本序列带来不同的权重分布。注意力机制根据查询计算出源文本序列中与下游任务最相关 的部分,意味着不同的查询会关注源文本的不同部 分,因此注意力机制可以看成是一种基于查询源文本表示方法,理论上适用于任何文本处理任务。 

这篇关于注意力机制:点积、通用、缩放点积、拼接、相加的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/545234

相关文章

PostgreSQL中MVCC 机制的实现

《PostgreSQL中MVCC机制的实现》本文主要介绍了PostgreSQL中MVCC机制的实现,通过多版本数据存储、快照隔离和事务ID管理实现高并发读写,具有一定的参考价值,感兴趣的可以了解一下... 目录一 MVCC 基本原理python1.1 MVCC 核心概念1.2 与传统锁机制对比二 Postg

Maven 配置中的 <mirror>绕过 HTTP 阻断机制的方法

《Maven配置中的<mirror>绕过HTTP阻断机制的方法》:本文主要介绍Maven配置中的<mirror>绕过HTTP阻断机制的方法,本文给大家分享问题原因及解决方案,感兴趣的朋友一... 目录一、问题场景:升级 Maven 后构建失败二、解决方案:通过 <mirror> 配置覆盖默认行为1. 配置示

Redis过期删除机制与内存淘汰策略的解析指南

《Redis过期删除机制与内存淘汰策略的解析指南》在使用Redis构建缓存系统时,很多开发者只设置了EXPIRE但却忽略了背后Redis的过期删除机制与内存淘汰策略,下面小编就来和大家详细介绍一下... 目录1、简述2、Redis http://www.chinasem.cn的过期删除策略(Key Expir

Go语言中Recover机制的使用

《Go语言中Recover机制的使用》Go语言的recover机制通过defer函数捕获panic,实现异常恢复与程序稳定性,具有一定的参考价值,感兴趣的可以了解一下... 目录引言Recover 的基本概念基本代码示例简单的 Recover 示例嵌套函数中的 Recover项目场景中的应用Web 服务器中

pandas实现数据concat拼接的示例代码

《pandas实现数据concat拼接的示例代码》pandas.concat用于合并DataFrame或Series,本文主要介绍了pandas实现数据concat拼接的示例代码,具有一定的参考价值,... 目录语法示例:使用pandas.concat合并数据默认的concat:参数axis=0,join=

c/c++的opencv图像金字塔缩放实现

《c/c++的opencv图像金字塔缩放实现》本文主要介绍了c/c++的opencv图像金字塔缩放实现,通过对原始图像进行连续的下采样或上采样操作,生成一系列不同分辨率的图像,具有一定的参考价值,感兴... 目录图像金字塔简介图像下采样 (cv::pyrDown)图像上采样 (cv::pyrUp)C++ O

Jvm sandbox mock机制的实践过程

《Jvmsandboxmock机制的实践过程》:本文主要介绍Jvmsandboxmock机制的实践过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、背景二、定义一个损坏的钟1、 Springboot工程中创建一个Clock类2、 添加一个Controller

Dubbo之SPI机制的实现原理和优势分析

《Dubbo之SPI机制的实现原理和优势分析》:本文主要介绍Dubbo之SPI机制的实现原理和优势,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Dubbo中SPI机制的实现原理和优势JDK 中的 SPI 机制解析Dubbo 中的 SPI 机制解析总结Dubbo中

Java 的 Condition 接口与等待通知机制详解

《Java的Condition接口与等待通知机制详解》在Java并发编程里,实现线程间的协作与同步是极为关键的任务,本文将深入探究Condition接口及其背后的等待通知机制,感兴趣的朋友一起看... 目录一、引言二、Condition 接口概述2.1 基本概念2.2 与 Object 类等待通知方法的区别

嵌入式Linux驱动中的异步通知机制详解

《嵌入式Linux驱动中的异步通知机制详解》:本文主要介绍嵌入式Linux驱动中的异步通知机制,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录前言一、异步通知的核心概念1. 什么是异步通知2. 异步通知的关键组件二、异步通知的实现原理三、代码示例分析1. 设备结构