ShuffleNet v1算法详解

2024-02-09 06:38
文章标签 算法 详解 shufflenet v1

本文主要是介绍ShuffleNet v1算法详解,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

论文地址:https://arxiv.org/pdf/1707.01083.pdf
Face++的一篇关于降低深度网络计算量的论文

什么是group convlution 群卷积 ?

我们假设上一层的输出feature map有N个,即通道数channel=N,也就是说上一层有N个卷积核。再假设群卷积的群数目M。那么该群卷积层的操作就是,先将channel分成M份。每一个group对应N/M个channel,与之独立连接。然后各个group卷积完成后将输出叠在一起(concatenate),作为这一层的输出channel。

该文章主要采用channel shuffle、pointwise group convolutions和depthwise separable convolution来修改原来的ResNet的bottleneck单元

Channel shuffle

     

  1. 图a做group convolution的方法:对于N个feature map M个filter(卷积核),group组数为g,则N,M都被分为g个组,第一个group中M/g个fliter的每一个filter都和第一个group中N/g个feature map做卷积得到结果,接着第二个,第三个….                   总结:feature map和卷积核都为相同的分组,然后对应组相卷积得到结果,这样做的目的就是可以大幅减少计算量如果有多   个卷积层都有group操作如图(a),这样就会产生边界效应:某个输出channel仅仅来自输入channel的一小部分,只能学习到一小部分的特征,于是提出了channel shuffle;简言之就是:如图a,最终的output输出只和输入的一小部分有关
  2. Channel shuffle图b,在进行Gconv之前,对其输入的feature map做了一个分配:将每个group分成几个subgroup,然后将group的每个subgroup作为GConv2的一个group的输入下一个Gconv的输入,如图c所示。

Pointwise group convolution (卷积核是1*1的卷积)

在ResNet中主要对3*3的卷积做group操作,但是在shuffleNet中,作者对1*1卷积做grounp的操作

文中计算了这三个unit的FLOPS:(我把计算式子写开,更容易理解)

其中c为输入通道数,m为输出通道数,g为group分组数

a为(2cm + 9m*m) = (c+3*3*m+c)*m

b为(2cm + 9m*m/g)= (c/g+3*3*m/g+c/g)*m

  1. 图a是ResNet中的bottleneck unit,不过将原来的3*3 Conv改成3*3 DW Conv
  2. 图b 是添加了group convolution 和channel shuffle
  3. bottleneck中添加average pooling,设置DWConv的步长为2,最后采用contact操作按channel合并代替ADD操作

实验结果

Table1是网络结构,设置不同的分组数的复杂度,Table2计算了不同ShuffleNet复杂度下的错误率。1X, 0.5X, 0,25X表示将网络的filter缩小s*s倍

Table2标题括号中的好像是有错误,应该为更小的s表现更大的分类错误率

此外作者还做了如下的比较,寻找最优的分组数g

不同模型的复杂度和错误率的比较

最后作者得出一个经验值,使用groung=3时可以得到一个准确率和运行时间的一个平衡。

这篇关于ShuffleNet v1算法详解的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/693410

相关文章

Java注解之超越Javadoc的元数据利器详解

《Java注解之超越Javadoc的元数据利器详解》本文将深入探讨Java注解的定义、类型、内置注解、自定义注解、保留策略、实际应用场景及最佳实践,无论是初学者还是资深开发者,都能通过本文了解如何利用... 目录什么是注解?注解的类型内置注编程解自定义注解注解的保留策略实际用例最佳实践总结在 Java 编程

MySQL数据库约束深入详解

《MySQL数据库约束深入详解》:本文主要介绍MySQL数据库约束,在MySQL数据库中,约束是用来限制进入表中的数据类型的一种技术,通过使用约束,可以确保数据的准确性、完整性和可靠性,需要的朋友... 目录一、数据库约束的概念二、约束类型三、NOT NULL 非空约束四、DEFAULT 默认值约束五、UN

Python使用Matplotlib绘制3D曲面图详解

《Python使用Matplotlib绘制3D曲面图详解》:本文主要介绍Python使用Matplotlib绘制3D曲面图,在Python中,使用Matplotlib库绘制3D曲面图可以通过mpl... 目录准备工作绘制简单的 3D 曲面图绘制 3D 曲面图添加线框和透明度控制图形视角Matplotlib

MySQL中的分组和多表连接详解

《MySQL中的分组和多表连接详解》:本文主要介绍MySQL中的分组和多表连接的相关操作,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友一起看看吧... 目录mysql中的分组和多表连接一、MySQL的分组(group javascriptby )二、多表连接(表连接会产生大量的数据垃圾)MySQL中的

Java 实用工具类Spring 的 AnnotationUtils详解

《Java实用工具类Spring的AnnotationUtils详解》Spring框架提供了一个强大的注解工具类org.springframework.core.annotation.Annot... 目录前言一、AnnotationUtils 的常用方法二、常见应用场景三、与 JDK 原生注解 API 的

redis中使用lua脚本的原理与基本使用详解

《redis中使用lua脚本的原理与基本使用详解》在Redis中使用Lua脚本可以实现原子性操作、减少网络开销以及提高执行效率,下面小编就来和大家详细介绍一下在redis中使用lua脚本的原理... 目录Redis 执行 Lua 脚本的原理基本使用方法使用EVAL命令执行 Lua 脚本使用EVALSHA命令

SpringBoot3.4配置校验新特性的用法详解

《SpringBoot3.4配置校验新特性的用法详解》SpringBoot3.4对配置校验支持进行了全面升级,这篇文章为大家详细介绍了一下它们的具体使用,文中的示例代码讲解详细,感兴趣的小伙伴可以参考... 目录基本用法示例定义配置类配置 application.yml注入使用嵌套对象与集合元素深度校验开发

Python中的Walrus运算符分析示例详解

《Python中的Walrus运算符分析示例详解》Python中的Walrus运算符(:=)是Python3.8引入的一个新特性,允许在表达式中同时赋值和返回值,它的核心作用是减少重复计算,提升代码简... 目录1. 在循环中避免重复计算2. 在条件判断中同时赋值变量3. 在列表推导式或字典推导式中简化逻辑

Java Stream流使用案例深入详解

《JavaStream流使用案例深入详解》:本文主要介绍JavaStream流使用案例详解,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录前言1. Lambda1.1 语法1.2 没参数只有一条语句或者多条语句1.3 一个参数只有一条语句或者多

SpringBoot整合mybatisPlus实现批量插入并获取ID详解

《SpringBoot整合mybatisPlus实现批量插入并获取ID详解》这篇文章主要为大家详细介绍了SpringBoot如何整合mybatisPlus实现批量插入并获取ID,文中的示例代码讲解详细... 目录【1】saveBATch(一万条数据总耗时:2478ms)【2】集合方式foreach(一万条数