Multi-modal Circulant Fusion for Video-to-Language and Backward(MCF)同时使用vector和matrix

本文主要是介绍Multi-modal Circulant Fusion for Video-to-Language and Backward(MCF)同时使用vector和matrix,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.多模态循环融合(MCF)

MCF的详细过程如图,x,y为不同模态特征向量,首先利用两个投影矩阵W1,W2将将特征投影到VC两个低维空间。

然后利用V、C构造循环矩阵A和B

为了使投影向量和循环矩阵中的元素充分作用,我们探索了两种不同的乘法运算

1)在循环矩阵和投影向量之间使用矩阵乘法

2)是让循环矩阵的投影向量和每行进行元素积

最后通过一个投影矩阵W3,将F和G的利用element-wise sum转换为M

2.MCF for Video Captioning

开发了一个视频->字幕框架:卷积编码器和解码器

在解码器中,将MCF作为粗略解码的基础层,在基础层上堆叠分层扩展以进行精细和最终解码。

因此用MCF构建了一个多级解码器

2.1卷积编码网络

1)特征提取:

使用预先训练的卷积网络对每m帧提取特征,产生向量Xi对第i帧

2)区别性提升:

对两个连续的帧Xi和Xi+1,计算帧间差别diff,然后通过relu运算,添加积极的diff到Xi+1,将消极的diff添加到Xi。

因而扩大区别性差异在Xi与Xi+1之间

Vi是提升结果

3)重构网络

我们构建了一个重构网络来学习每个视频帧的紧凑表示

We是卷积权重,Zi是学习的紧致表示,Wd是重构权重,Ri是重构结果

L是损失函数

2.2Multi-stage Convolutional Decoder with MCF

多级顺序解码器示意图。对于这个解码器,我们首先使用MCF来获得视觉特征和单词嵌入特征的联合表示。然后我们把联合表示作为这个解码器的输入。“粗略”、“精细”和“最终”表示解码器的三个阶段。相应的不断改进的视频描述以绿色、黄色和橙色显示

预测单词序列用第j个解码器:

目标单词序列:

1)MCF作为粗解码器

在底部阶段,用一个扩展卷积层来学习一个粗解码器,在每一个时间t,粗解码器的输入包括先前的目标单词Yt-1和mean向量Zmean(编码器的输出)

一开始用MCF去获得联合表示

MCF(a,b)表示使用MCF去融合a和b

wfwg表示第0层的卷积权重

2)改进解码器

由两个阶段组成,第一个阶段包含三个扩张的卷积层,第二阶段仅包括一个堆叠在第一级之上的扩展卷积层。第二阶段的预测作为最终描述。

改进解码器:

对于第一个改进解码器,使用粗解码器的输出h0来计算视觉注意力

该改进解码器中第一层的操作:

w1是可学习的权重,用于转换级联表示的通道

然后第一改进解码器的下两层操作

第二个改进的解码器:

 

 

这篇关于Multi-modal Circulant Fusion for Video-to-Language and Backward(MCF)同时使用vector和matrix的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/468006

相关文章

使用Python实现IP地址和端口状态检测与监控

《使用Python实现IP地址和端口状态检测与监控》在网络运维和服务器管理中,IP地址和端口的可用性监控是保障业务连续性的基础需求,本文将带你用Python从零打造一个高可用IP监控系统,感兴趣的小伙... 目录概述:为什么需要IP监控系统使用步骤说明1. 环境准备2. 系统部署3. 核心功能配置系统效果展

使用Java将各种数据写入Excel表格的操作示例

《使用Java将各种数据写入Excel表格的操作示例》在数据处理与管理领域,Excel凭借其强大的功能和广泛的应用,成为了数据存储与展示的重要工具,在Java开发过程中,常常需要将不同类型的数据,本文... 目录前言安装免费Java库1. 写入文本、或数值到 Excel单元格2. 写入数组到 Excel表格

redis中使用lua脚本的原理与基本使用详解

《redis中使用lua脚本的原理与基本使用详解》在Redis中使用Lua脚本可以实现原子性操作、减少网络开销以及提高执行效率,下面小编就来和大家详细介绍一下在redis中使用lua脚本的原理... 目录Redis 执行 Lua 脚本的原理基本使用方法使用EVAL命令执行 Lua 脚本使用EVALSHA命令

Java 中的 @SneakyThrows 注解使用方法(简化异常处理的利与弊)

《Java中的@SneakyThrows注解使用方法(简化异常处理的利与弊)》为了简化异常处理,Lombok提供了一个强大的注解@SneakyThrows,本文将详细介绍@SneakyThro... 目录1. @SneakyThrows 简介 1.1 什么是 Lombok?2. @SneakyThrows

使用Python和Pyecharts创建交互式地图

《使用Python和Pyecharts创建交互式地图》在数据可视化领域,创建交互式地图是一种强大的方式,可以使受众能够以引人入胜且信息丰富的方式探索地理数据,下面我们看看如何使用Python和Pyec... 目录简介Pyecharts 简介创建上海地图代码说明运行结果总结简介在数据可视化领域,创建交互式地

Java Stream流使用案例深入详解

《JavaStream流使用案例深入详解》:本文主要介绍JavaStream流使用案例详解,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录前言1. Lambda1.1 语法1.2 没参数只有一条语句或者多条语句1.3 一个参数只有一条语句或者多

Java Spring 中 @PostConstruct 注解使用原理及常见场景

《JavaSpring中@PostConstruct注解使用原理及常见场景》在JavaSpring中,@PostConstruct注解是一个非常实用的功能,它允许开发者在Spring容器完全初... 目录一、@PostConstruct 注解概述二、@PostConstruct 注解的基本使用2.1 基本代

C#使用StackExchange.Redis实现分布式锁的两种方式介绍

《C#使用StackExchange.Redis实现分布式锁的两种方式介绍》分布式锁在集群的架构中发挥着重要的作用,:本文主要介绍C#使用StackExchange.Redis实现分布式锁的... 目录自定义分布式锁获取锁释放锁自动续期StackExchange.Redis分布式锁获取锁释放锁自动续期分布式

springboot使用Scheduling实现动态增删启停定时任务教程

《springboot使用Scheduling实现动态增删启停定时任务教程》:本文主要介绍springboot使用Scheduling实现动态增删启停定时任务教程,具有很好的参考价值,希望对大家有... 目录1、配置定时任务需要的线程池2、创建ScheduledFuture的包装类3、注册定时任务,增加、删

使用Python实现矢量路径的压缩、解压与可视化

《使用Python实现矢量路径的压缩、解压与可视化》在图形设计和Web开发中,矢量路径数据的高效存储与传输至关重要,本文将通过一个Python示例,展示如何将复杂的矢量路径命令序列压缩为JSON格式,... 目录引言核心功能概述1. 路径命令解析2. 路径数据压缩3. 路径数据解压4. 可视化代码实现详解1