《南溪的目标检测学习笔记》——常见算子的学习笔记

2024-01-22 10:18

本文主要是介绍《南溪的目标检测学习笔记》——常见算子的学习笔记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

Basic

Optimality Theory

在最优化理论中,我们可以将算子看作是向量值函数映射,
在这里插入图片描述
举例来说,这里:

  • 输入张量 X \mathcal{X} X看作是向量 x ∈ R n \mathbf{x} \in \mathbb{R}^n xRn
  • 输出张量 Y \mathcal{Y} Y看作是向量 y ∈ R m \mathbf{y} \in \mathbb{R}^m yRm
  • 张量 X \mathcal{X} X的维度平铺之后可以看作为向量,即: n = N C H W n=NCHW n=NCHW

1 Convolution

1.2 乘性注意力卷积: Y = X ⋅ M \mathcal{Y} = \mathcal{X} \cdot\mathcal{M} Y=XM

CCA Block: BSNR.CCALayer

这里我们使用BSNR论文中的图来学习 CCA Block 
在这里插入图片描述
在CCA生产注意力时,有一个很有趣的模块Contrast,它的实现是这样的 [Contrast | stdv_channels()]

def stdv_channels(F):assert (F.dim() == 4)F_mean = mean_channels(F)F_variance = (F - F_mean).pow(2).sum(3, keepdim=True).sum(2, keepdim=True) / (F.size(2) * F.size(3))return F_variance.pow(0.5)contrast = stdv_channels

相当于InstanceNorm的前半部分的分布归一化;

2 Activation

2.2 Softmax:非线性归一化

数学公式:
Softmax ⁡ ( x i ) = exp ⁡ ( x i ) ∑ j exp ⁡ ( x j ) \operatorname{Softmax}\left(x_i\right)=\frac{\exp \left(x_i\right)}{\sum_j \exp \left(x_j\right)} Softmax(xi)=jexp(xj)exp(xi)

3 Sampling

4.1 Down Sampling

Down sampleFPSBS
Focuswait…wait…
Nearestwait…wait…
Bilinearwait…wait…
Bicubicwait…wait…
MaxPoolwait…wait…
AdaptiveMaxPoolwait…wait…

2.2 Up Sampling

Conv+PixelShuffle: Learnable sub-pixel layer

第一次看到这个上采样算子是在RFDN模型中,其代码为: [code]

def pixelshuffle_block(in_channels, out_channels, upscale_factor=2, kernel_size=3, stride=1):conv = conv_layer(in_channels, out_channels * (upscale_factor ** 2), kernel_size, stride)pixel_shuffle = nn.PixelShuffle(upscale_factor)return sequential(conv, pixel_shuffle)

3 Information Exchange

3.1 ChannelShuffle: A good competitor of 1*1 convolutiuon [SOURCE]

ChannelShuffle是ShuffleNetV2中十分经典的算子,从效果上看,其主要作用是进行了通道间的信息交换,这一点跟 1*1-Conv 的作用十分类似;
ShuffleNetV2中,使用ChannelShuffle的语句是:out = channel_shuffle(out, 2),届在cat操作后面实现res特征与conv特征的信息交换;

4 Pooling

关于池化层的基本实现,请参考《22 池化层【动手学深度学习v2】》;

5 Experiment

Hardware for Test

GPU: 2080Ti (Turing)

Input size

我们需要对算子占用的显存大小进行测试,在测试时需要模拟输入的特征张量,对于输入特征图的大小,这里我们使用YOLOv5主干部分计算量密集(即使用了多个C3模块)stages的输出特征图尺寸取平均值:

nums_C3s = (3,6,9,3)
(160*nums_C3s[0] + 80*nums_C3s[1] + 40*nums_C3s[2] + 20*nums_C3s[3])/sum(nums_C3s)
>>> 65.71428571428571

这里我们取最近的8的倍数,也就是128;

这篇关于《南溪的目标检测学习笔记》——常见算子的学习笔记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/632674

相关文章

Python struct.unpack() 用法及常见错误详解

《Pythonstruct.unpack()用法及常见错误详解》struct.unpack()是Python中用于将二进制数据(字节序列)解析为Python数据类型的函数,通常与struct.pa... 目录一、函数语法二、格式字符串详解三、使用示例示例 1:解析整数和浮点数示例 2:解析字符串示例 3:解

Android学习总结之Java和kotlin区别超详细分析

《Android学习总结之Java和kotlin区别超详细分析》Java和Kotlin都是用于Android开发的编程语言,它们各自具有独特的特点和优势,:本文主要介绍Android学习总结之Ja... 目录一、空安全机制真题 1:Kotlin 如何解决 Java 的 NullPointerExceptio

MySQL查看表的最后一个ID的常见方法

《MySQL查看表的最后一个ID的常见方法》在使用MySQL数据库时,我们经常会遇到需要查看表中最后一个id值的场景,无论是为了调试、数据分析还是其他用途,了解如何快速获取最后一个id都是非常实用的技... 目录背景介绍方法一:使用MAX()函数示例代码解释适用场景方法二:按id降序排序并取第一条示例代码解

IDEA实现回退提交的git代码(四种常见场景)

《IDEA实现回退提交的git代码(四种常见场景)》:本文主要介绍IDEA实现回退提交的git代码(四种常见场景),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1.已提交commit,还未push到远端(Undo Commit)2.已提交commit并push到

python进行while遍历的常见错误解析

《python进行while遍历的常见错误解析》在Python中选择合适的遍历方式需要综合考虑可读性、性能和具体需求,本文就来和大家讲解一下python中while遍历常见错误以及所有遍历方法的优缺点... 目录一、超出数组范围问题分析错误复现解决方法关键区别二、continue使用问题分析正确写法关键点三

JAVA数组中五种常见排序方法整理汇总

《JAVA数组中五种常见排序方法整理汇总》本文给大家分享五种常用的Java数组排序方法整理,每种方法结合示例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录前言:法一:Arrays.sort()法二:冒泡排序法三:选择排序法四:反转排序法五:直接插入排序前言:几种常用的Java数组排序

正则表达式r前缀使用指南及如何避免常见错误

《正则表达式r前缀使用指南及如何避免常见错误》正则表达式是处理字符串的强大工具,但它常常伴随着转义字符的复杂性,本文将简洁地讲解r的作用、基本原理,以及如何在实际代码中避免常见错误,感兴趣的朋友一... 目录1. 字符串的双重翻译困境2. 为什么需要 r?3. 常见错误和正确用法4. Unicode 转换的

重新对Java的类加载器的学习方式

《重新对Java的类加载器的学习方式》:本文主要介绍重新对Java的类加载器的学习方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍1.1、简介1.2、符号引用和直接引用1、符号引用2、直接引用3、符号转直接的过程2、加载流程3、类加载的分类3.1、显示

C语言中的常见进制转换详解(从二进制到十六进制)

《C语言中的常见进制转换详解(从二进制到十六进制)》进制转换是计算机编程中的一个常见任务,特别是在处理低级别的数据操作时,C语言作为一门底层编程语言,在进制转换方面提供了灵活的操作方式,今天,我们将深... 目录1、进制基础2、C语言中的进制转换2.1 从十进制转换为其他进制十进制转二进制十进制转八进制十进

在 PyQt 加载 UI 三种常见方法

《在PyQt加载UI三种常见方法》在PyQt中,加载UI文件通常指的是使用QtDesigner设计的.ui文件,并将其转换为Python代码,以便在PyQt应用程序中使用,这篇文章给大家介绍在... 目录方法一:使用 uic 模块动态加载 (不推荐用于大型项目)方法二:将 UI 文件编译为 python 模