《Learning Spatiotemporal Features with 3D Convolutional Networks》解读

本文主要是介绍《Learning Spatiotemporal Features with 3D Convolutional Networks》解读,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

创新点:
1、本文论证了3D卷积在时空特征学习的有效性,并在4个数据集上对比2D卷积及光流法、iDT法的有效性;
2、本文证明了333卷积的有效性,在UCF-101上证明了时空深度的变化和空间大小的变化对结果没有什么关键影响;
3、提出了3D卷积的架构,对过程进行可视化,论证了为什么3D卷积比较好;

学到的东西:
1、视频描述符的四个属性:1.通用型;2.紧凑性;3.高效性;4.简单性;
2、2D卷积和3D卷积的过程的差别,如下图:
2D卷积和3D卷积区别
3、UCF-101的处理方式:1.将视频分割成316128*171的片段30片,其中每连续两片之间有8帧的重叠;2.提取每个片段的fc6特征信息,通过平均到4096维video描述向量,并通过L2进行标准化;3.通过svm进行分类操作,并且在附录部分证明了128大小的图像效果更好;
4、[29]中使用120帧视频表现比C3D好,说明长帧会让分类更加准确,但是带来资源的浪费;
5、[46]解释了为什么3D卷积兼顾了运动与外观特征;
6、使用3个数据集分别训练出3个网络,并使用L2规则化比单一网络更具有范化性,性能更好,并且使用iDT特征与RGB的结合使得性能大幅度提高(对应之前的使用光流法和RGB进行提高精度的网络的结论),因为iDT和光流特征都是底层特征,3D卷积捕捉了抽象信息,结合使得更好;
7、3D卷积在PCA特征分析上表明特征的聚集性更高,并且使用t-SNE[43]进行特征可视化表明,3D卷积的可分离性更好;
8、对ground truth的标签设定:在16帧里面,出现最多的标签,作为整个视频帧的标签,但如果最多的标签少于8帧,则这个16帧被认定为没有object的负样本;

这篇关于《Learning Spatiotemporal Features with 3D Convolutional Networks》解读的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/696088

相关文章

Three.js构建一个 3D 商品展示空间完整实战项目

《Three.js构建一个3D商品展示空间完整实战项目》Three.js是一个强大的JavaScript库,专用于在Web浏览器中创建3D图形,:本文主要介绍Three.js构建一个3D商品展... 目录引言项目核心技术1. 项目架构与资源组织2. 多模型切换、交互热点绑定3. 移动端适配与帧率优化4. 可

C语言自定义类型之联合和枚举解读

《C语言自定义类型之联合和枚举解读》联合体共享内存,大小由最大成员决定,遵循对齐规则;枚举类型列举可能值,提升可读性和类型安全性,两者在C语言中用于优化内存和程序效率... 目录一、联合体1.1 联合体类型的声明1.2 联合体的特点1.2.1 特点11.2.2 特点21.2.3 特点31.3 联合体的大小1

Python标准库datetime模块日期和时间数据类型解读

《Python标准库datetime模块日期和时间数据类型解读》文章介绍Python中datetime模块的date、time、datetime类,用于处理日期、时间及日期时间结合体,通过属性获取时间... 目录Datetime常用类日期date类型使用时间 time 类型使用日期和时间的结合体–日期时间(

C语言中%zu的用法解读

《C语言中%zu的用法解读》size_t是无符号整数类型,用于表示对象大小或内存操作结果,%zu是C99标准中专为size_t设计的printf占位符,避免因类型不匹配导致错误,使用%u或%d可能引发... 目录size_t 类型与 %zu 占位符%zu 的用途替代占位符的风险兼容性说明其他相关占位符验证示

Linux系统之lvcreate命令使用解读

《Linux系统之lvcreate命令使用解读》lvcreate是LVM中创建逻辑卷的核心命令,支持线性、条带化、RAID、镜像、快照、瘦池和缓存池等多种类型,实现灵活存储资源管理,需注意空间分配、R... 目录lvcreate命令详解一、命令概述二、语法格式三、核心功能四、选项详解五、使用示例1. 创建逻

解读GC日志中的各项指标用法

《解读GC日志中的各项指标用法》:本文主要介绍GC日志中的各项指标用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、基础 GC 日志格式(以 G1 为例)1. Minor GC 日志2. Full GC 日志二、关键指标解析1. GC 类型与触发原因2. 堆

Java设计模式---迭代器模式(Iterator)解读

《Java设计模式---迭代器模式(Iterator)解读》:本文主要介绍Java设计模式---迭代器模式(Iterator),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,... 目录1、迭代器(Iterator)1.1、结构1.2、常用方法1.3、本质1、解耦集合与遍历逻辑2、统一

MySQL之InnoDB存储页的独立表空间解读

《MySQL之InnoDB存储页的独立表空间解读》:本文主要介绍MySQL之InnoDB存储页的独立表空间,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、背景2、独立表空间【1】表空间大小【2】区【3】组【4】段【5】区的类型【6】XDES Entry区结构【

使用Python绘制3D堆叠条形图全解析

《使用Python绘制3D堆叠条形图全解析》在数据可视化的工具箱里,3D图表总能带来眼前一亮的效果,本文就来和大家聊聊如何使用Python实现绘制3D堆叠条形图,感兴趣的小伙伴可以了解下... 目录为什么选择 3D 堆叠条形图代码实现:从数据到 3D 世界的搭建核心代码逐行解析细节优化应用场景:3D 堆叠图

MySQL主从复制与读写分离的用法解读

《MySQL主从复制与读写分离的用法解读》:本文主要介绍MySQL主从复制与读写分离的用法,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、主从复制mysql主从复制原理实验案例二、读写分离实验案例安装并配置mycat 软件设置mycat读写分离验证mycat读