为什么MobileNet及其变体(比如ShuffleNet)会怎么快呢?

2024-06-21 09:32

本文主要是介绍为什么MobileNet及其变体(比如ShuffleNet)会怎么快呢?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

点击上方“AI公园”,关注公众号,选择加“星标“或“置顶”


作者:Yusuke Uchida

编译:ronghuaiyang

导读

MobileNet的特点就是非常的快,而且精度损失很小,这里面的原因是什么呢,这篇文章给大家解密。

介绍

在本文中,我将概述在诸如MobileNet及其变体等高效的CNN模型中使用的构建块,并解释一下为什么它们为何如此高效。特别地,我直观的说明了关于空间和通道卷积是如何完成。

高效模型中的构建块

在解释特定的高效CNN模型之前,让我们先检查一下高效CNN模型中使用的构建块的计算成本,看看如何在空间和通道域中执行卷积。

640?wx_fmt=png

让HxW表示输出特征图的空间尺寸,N表示输入通道的数量,KxK表示卷积核的大小,M表示输出通道的数量,计算标准卷积的成本为HWNK²M。

很重要的一点是,和标准卷积的计算成本成正比的有(1)输出特征图的空间尺寸HxW、(2)卷积核的大小K²、(3)输入和输出通道的数量NxM。

在空间域和通道域同时进行卷积时,需要上述计算量。CNNs可以通过分解这个卷积来加速,如下面的图所示。

卷积

首先,我提供了一个直观的例子,关于标准卷积在空间和通道域是怎么做的,其计算成本HWNK²M。

我将输入和输出之间的线连接起来,以可视化输入和输出之间的依赖关系。行数大致分别表示卷积在空间域和通道域的计算成本。

640?wx_fmt=png

例如,conv3x3,最常用的卷积,可以可视化,如上图。我们可以看到输入和输出在空间域上是局部连接的,而在通道域上是全连接的。

640?wx_fmt=png

接下来,conv1x1,又叫做逐点卷积,或用于改变通道的数量,可视化如上图。这个卷积的计算量是HWNM,因为核的大小是1x1,与conv3x3相比,计算量减少了1/9。这个卷积用于在通道之间“混合”信息。

分组卷积

分组卷积是卷积的一种变体,其中对输入特征图的通道进行分组,并对每个分组的通道独立执行卷积。

让G表示数量的组,分组卷积的计算成本HWNK²M / G,计算量想不标准的卷积降低为1 / G。

640?wx_fmt=png

对conv3x3进行分组,G=2。上图我们可以看到,通道域中的连接数比标准卷积小,这表明计算量更小。

640?wx_fmt=png

上图的这种情况,conv3x3,分组G=3,连接变得更加稀疏。

640?wx_fmt=png

上图的这种情况,conv1x1,分组G=2,因此,conv1x1也可以分组。这种卷积在ShuffleNet中使用。。

640?wx_fmt=png

上图的这种情况,conv1x1,分组G=3

深度卷积

在深度卷积中,卷积是对每个输入通道独立执行的。它也可以定义为分组卷积的一种特殊情况,其中输入和输出通道的数量相同,G等于通道的数量。

640?wx_fmt=png

如上所示,深度卷积通去掉了在通道域上的卷积,显著降低了计算成本。

通道洗牌

通道洗牌是一种操作(层),它改变了在ShuffleNet中使用的通道的顺序。这个操作是通过张量的变形和转置来实现的。

更精确地说,让GN ' (=N)表示输入通道的数量,首先将输入通道维数重新构造为(G, N '),然后将(G, N ')转置为(N ', G),最后将其压平为与输入相同的形状。这里G表示分组卷积的组数,在ShuffleNet中与通道洗牌层一起使用。

虽然通道洗牌的计算量不能根据multiply-add操作(MACs)的数量来定义,但是应该有一些开销。

640?wx_fmt=png

通道洗牌的情况下,G=2。不执行卷积,只是改变通道的顺序。

640?wx_fmt=png

通道洗牌的情况下,G=3。

高效模型

在下面的文章中,我将为高效CNN模型提供直观的说明,说明为什么它们是高效的,以及如何在空间和通道域进行卷积。

ResNet (Bottleneck Version)

ResNet中使用的带有bottleneck结构的残差单元是与其他模型进行进一步比较的良好起点。

640?wx_fmt=png

如上图所示,由conv1x1、conv3x3和conv1x1组成具有bottleneck 结构的残差单元。第一个conv1x1降低了输入通道的维数,降低了后续相对昂贵的conv3x3的计算成本。最后一个conv1x1恢复输出通道的维数。

ResNeXt

ResNeXt是一个高效的CNN模型,它可以看作是ResNet的一个特例,其中conv3x3被分组conv3x3所替代。通过使用有效的分组卷积,,conv1x1中的通道压缩率与ResNet相比变得温和,从而在相同的计算成本下提高了精度。

640?wx_fmt=png

MobileNet (可分离卷积)

MobileNet是由深度卷积和conv1x1(逐点卷积)组成的可分离卷积模块的堆叠。

640?wx_fmt=png

可分离卷积在空间和通道域中独立地执行卷积。这种分解的卷积显著降低了计算成本,从HWNK²M降到了HWNK²(depthwise)+ HWNM (conv1x1),总共是HWN (K²+ M)。一般来说,M > > K²(例如K = 3 M≥32),计算量大约是原来的1/8-1/9。

这里重要的一点是,计算量的瓶颈现在是conv1x1!

ShuffleNet

ShuffleNet的动机是,如上所述,conv1x1是可分离conv的瓶颈。虽然conv1x1已经是很高效的了,而且似乎没有改进的空间,但分组conv1x1可以用来减少计算量。

640?wx_fmt=png

上图演示了ShuffleNet的模块。这里的一个重要构建块是通道洗牌层,它以分组卷积的方式“洗牌”组间通道的顺序。在没有通道洗牌的情况下,分组卷积的输出永远不会利用组之间的信息,从而导致精度下降。

MobileNet-v2

MobileNet-v2采用了与ResNet的bottleneck结构类似的残差单元模块结构,修改后的残差单元将conv3x3替换为了深度卷积。

640?wx_fmt=png

从上面可以看出,与标准bottleneck架构相反,第一个conv1x1增加了通道维度,然后执行深度conv,最后一个conv1x1减少了通道维度。

640?wx_fmt=png

通过像上面那样重新排序构建块,并将其与MobileNet-v1(可分离conv)进行比较,我们可以看到这个架构是如何工作的(这种重新排序不会改变整个模型架构,因为MobileNet-v2是这个模块的堆叠)。

也就是说,上面的模块是可分离conv的一个改进版本,其中可分离conv中的单个conv1x1被分解成两个conv1x1。T表示通道尺寸的膨胀系数,计算两个conv1x1的成本是2HWN²/T,而在可分离卷积中的conv1x1的计算量是HWN²。在论文中,使用T = 6,将conv1x1的计算成本降低了3倍(一般为T/2)。

FD-MobileNet

最后,介绍一下快速下采样MobileNet (FD-MobileNet)。在该模型中,与MobileNet相比,下采样是在较早的层中进行的。这个简单的技巧可以减少总计算成本。其原因在于传统的下采样策略和可分离卷积的计算成本。

从VGGNet开始,许多模型采用相同的下采样策略:执行下采样,然后将后续层的通道数加倍。标准卷积的计算成本在采样后不会改变,因为它被定义为HWNK²M。而对于可分离卷积,下采样后计算量变小,从HWN(K²+M)减少为H/2 W/2 2N(K²+2M)= HWN (K²/2+M)。当M不是特别大的时候这是相对可观的(在早期的层中)。

我用下面的速查表来结束这篇文章,谢谢:P

640?wx_fmt=png

640?wx_fmt=png— END—

英文原文:https://medium.com/@yu4u/why-mobilenet-and-its-variants-e-g-shufflenet-are-fast-1c7048b9618d

640?wx_fmt=jpeg

请长按或扫描二维码关注本公众号

喜欢的话,请给我个好看吧640?wx_fmt=gif

这篇关于为什么MobileNet及其变体(比如ShuffleNet)会怎么快呢?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1080848

相关文章

qt5cored.dll报错怎么解决? 电脑qt5cored.dll文件丢失修复技巧

《qt5cored.dll报错怎么解决?电脑qt5cored.dll文件丢失修复技巧》在进行软件安装或运行程序时,有时会遇到由于找不到qt5core.dll,无法继续执行代码,这个问题可能是由于该文... 遇到qt5cored.dll文件错误时,可能会导致基于 Qt 开发的应用程序无法正常运行或启动。这种错

电脑提示xlstat4.dll丢失怎么修复? xlstat4.dll文件丢失处理办法

《电脑提示xlstat4.dll丢失怎么修复?xlstat4.dll文件丢失处理办法》长时间使用电脑,大家多少都会遇到类似dll文件丢失的情况,不过,解决这一问题其实并不复杂,下面我们就来看看xls... 在Windows操作系统中,xlstat4.dll是一个重要的动态链接库文件,通常用于支持各种应用程序

Mac备忘录怎么导出/备份和云同步? Mac备忘录使用技巧

《Mac备忘录怎么导出/备份和云同步?Mac备忘录使用技巧》备忘录作为iOS里简单而又不可或缺的一个系统应用,上手容易,可以满足我们日常生活中各种记录的需求,今天我们就来看看Mac备忘录的导出、... 「备忘录」是 MAC 上的一款常用应用,它可以帮助我们捕捉灵感、记录待办事项或保存重要信息。为了便于在不同

springboot+vue项目怎么解决跨域问题详解

《springboot+vue项目怎么解决跨域问题详解》:本文主要介绍springboot+vue项目怎么解决跨域问题的相关资料,包括前端代理、后端全局配置CORS、注解配置和Nginx反向代理,... 目录1. 前端代理(开发环境推荐)2. 后端全局配置 CORS(生产环境推荐)3. 后端注解配置(按接口

电脑死机无反应怎么强制重启? 一文读懂方法及注意事项

《电脑死机无反应怎么强制重启?一文读懂方法及注意事项》在日常使用电脑的过程中,我们难免会遇到电脑无法正常启动的情况,本文将详细介绍几种常见的电脑强制开机方法,并探讨在强制开机后应注意的事项,以及如何... 在日常生活和工作中,我们经常会遇到电脑突然无反应的情况,这时候强制重启就成了解决问题的“救命稻草”。那

电脑开机提示krpt.dll丢失怎么解决? krpt.dll文件缺失的多种解决办法

《电脑开机提示krpt.dll丢失怎么解决?krpt.dll文件缺失的多种解决办法》krpt.dll是Windows操作系统中的一个动态链接库文件,它对于系统的正常运行起着重要的作用,本文将详细介绍... 在使用 Windows 操作系统的过程中,用户有时会遇到各种错误提示,其中“找不到 krpt.dll”

MySql死锁怎么排查的方法实现

《MySql死锁怎么排查的方法实现》本文主要介绍了MySql死锁怎么排查的方法实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录前言一、死锁排查方法1. 查看死锁日志方法 1:启用死锁日志输出方法 2:检查 mysql 错误

Rsnapshot怎么用? 基于Rsync的强大Linux备份工具使用指南

《Rsnapshot怎么用?基于Rsync的强大Linux备份工具使用指南》Rsnapshot不仅可以备份本地文件,还能通过SSH备份远程文件,接下来详细介绍如何安装、配置和使用Rsnaps... Rsnapshot 是一款开源的文件系统快照工具。它结合了 Rsync 和 SSH 的能力,可以帮助你在 li

电脑密码怎么设置? 一文读懂电脑密码的详细指南

《电脑密码怎么设置?一文读懂电脑密码的详细指南》为了保护个人隐私和数据安全,设置电脑密码显得尤为重要,那么,如何在电脑上设置密码呢?详细请看下文介绍... 设置电脑密码是保护个人隐私、数据安全以及系统安全的重要措施,下面以Windows 11系统为例,跟大家分享一下设置电脑密码的具体办php法。Windo

怎么关闭Ubuntu无人值守升级? Ubuntu禁止自动更新的技巧

《怎么关闭Ubuntu无人值守升级?Ubuntu禁止自动更新的技巧》UbuntuLinux系统禁止自动更新的时候,提示“无人值守升级在关机期间,请不要关闭计算机进程”,该怎么解决这个问题?详细请看... 本教程教你如何处理无人值守的升级,即 Ubuntu linux 的自动系统更新。来源:https://