【深度学习】关于CNN网络的FLOPs的计算

2023-12-13 16:08

本文主要是介绍【深度学习】关于CNN网络的FLOPs的计算,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在评估一个CNN网络的计算复杂度时,浮点数运算(float point operation)是一个常用的衡量指标。注意本文介绍的主要是MAC(乘法加法操作),在一些论文里是仅仅考虑乘法操作的。

在常规的计算中,通常不考虑非线性函数的计算量(the nonlinearity),对于卷积操作:(带bias)

F L O P s = 2 ∗ H W ∗ ( C i n K 2 + 1 ) C o u t = 2 ∗ ( H W K 2 C i n C o u t + H W C o u t ) FLOPs = 2*HW*(C_{in}K^{2}+1)C_{out} \\ =2*(HWK^{2}C_{in}C_{out} +HW C_{out}) FLOPs=2HW(CinK2+1)Cout=2(HWK2CinCout+HWCout)

此处经评论提醒,已更正
其中式子中 H W K 2 C i n C o u t HWK^{2}C_{in}C_{out} HWK2CinCout为卷积操作, H W C o u t HWC_{out} HWCout为bias操作,2则表示为MAC操作(包含累加及累乘)

上面是NVIDIA在文章《PRUNING CONVOLUTIONAL NEURAL NETWORKS FOR RESOURCE EFFICIENT INFERENCE》文章中的计算方式。

但有人认为这是一种估算,他们认为对于卷积的计算量计算如下(不含bias):

F L O P s = ( 2 ∗ C i n ∗ K 2 − 1 ) ∗ H ∗ W ∗ C o u t FLOPs = (2*C_{in}*K^{2} - 1) * H * W * C_{out} FLOPs=(2CinK21)HWCout

其中第一个括号可拆成 ( C i n ∗ K 2 + C i n ∗ K 2 − 1 ) (C_{in} * K^{2} + C_{in} * K^{2} -1) (CinK2+CinK21),原因是n个数相加需要n-1次加法,此处不含bias。若没有-1则是带bias的计算方式。他们认为Nvidia是一种估算。

实际上两种计算的差别不是很大。

对于全连接操作:输入维度 I I I,输出维度 O O O,则全连接层(不含bias):

F L O P s = ( 2 × I − 1 ) × O FLOPs = (2 \times I-1) \times O FLOPs=(2×I1)×O

全连接操作,含bias:

F L O P s = 2 × I × O FLOPs = 2 \times I \times O FLOPs=2×I×O

这里是没有考虑全连接中的bias操作,比如x1+x2+…xn只有(n-1)次加法。

Ref:

  1. PRUNING CONVOLUTIONAL NEURAL NETWORKS FOR RESOURCE EFFICIENT INFERENCE
  2. https://www.zhihu.com/question/65305385/answer/451060549

这篇关于【深度学习】关于CNN网络的FLOPs的计算的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/489075

相关文章

Maven 插件配置分层架构深度解析

《Maven插件配置分层架构深度解析》:本文主要介绍Maven插件配置分层架构深度解析,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录Maven 插件配置分层架构深度解析引言:当构建逻辑遇上复杂配置第一章 Maven插件配置的三重境界1.1 插件配置的拓扑

重新对Java的类加载器的学习方式

《重新对Java的类加载器的学习方式》:本文主要介绍重新对Java的类加载器的学习方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍1.1、简介1.2、符号引用和直接引用1、符号引用2、直接引用3、符号转直接的过程2、加载流程3、类加载的分类3.1、显示

Linux高并发场景下的网络参数调优实战指南

《Linux高并发场景下的网络参数调优实战指南》在高并发网络服务场景中,Linux内核的默认网络参数往往无法满足需求,导致性能瓶颈、连接超时甚至服务崩溃,本文基于真实案例分析,从参数解读、问题诊断到优... 目录一、问题背景:当并发连接遇上性能瓶颈1.1 案例环境1.2 初始参数分析二、深度诊断:连接状态与

windows和Linux使用命令行计算文件的MD5值

《windows和Linux使用命令行计算文件的MD5值》在Windows和Linux系统中,您可以使用命令行(终端或命令提示符)来计算文件的MD5值,文章介绍了在Windows和Linux/macO... 目录在Windows上:在linux或MACOS上:总结在Windows上:可以使用certuti

Qt实现网络数据解析的方法总结

《Qt实现网络数据解析的方法总结》在Qt中解析网络数据通常涉及接收原始字节流,并将其转换为有意义的应用层数据,这篇文章为大家介绍了详细步骤和示例,感兴趣的小伙伴可以了解下... 目录1. 网络数据接收2. 缓冲区管理(处理粘包/拆包)3. 常见数据格式解析3.1 jsON解析3.2 XML解析3.3 自定义

Java学习手册之Filter和Listener使用方法

《Java学习手册之Filter和Listener使用方法》:本文主要介绍Java学习手册之Filter和Listener使用方法的相关资料,Filter是一种拦截器,可以在请求到达Servl... 目录一、Filter(过滤器)1. Filter 的工作原理2. Filter 的配置与使用二、Listen

Python中__init__方法使用的深度解析

《Python中__init__方法使用的深度解析》在Python的面向对象编程(OOP)体系中,__init__方法如同建造房屋时的奠基仪式——它定义了对象诞生时的初始状态,下面我们就来深入了解下_... 目录一、__init__的基因图谱二、初始化过程的魔法时刻继承链中的初始化顺序self参数的奥秘默认

Linux系统配置NAT网络模式的详细步骤(附图文)

《Linux系统配置NAT网络模式的详细步骤(附图文)》本文详细指导如何在VMware环境下配置NAT网络模式,包括设置主机和虚拟机的IP地址、网关,以及针对Linux和Windows系统的具体步骤,... 目录一、配置NAT网络模式二、设置虚拟机交换机网关2.1 打开虚拟机2.2 管理员授权2.3 设置子

揭秘Python Socket网络编程的7种硬核用法

《揭秘PythonSocket网络编程的7种硬核用法》Socket不仅能做聊天室,还能干一大堆硬核操作,这篇文章就带大家看看Python网络编程的7种超实用玩法,感兴趣的小伙伴可以跟随小编一起... 目录1.端口扫描器:探测开放端口2.简易 HTTP 服务器:10 秒搭个网页3.局域网游戏:多人联机对战4.

SpringCloud动态配置注解@RefreshScope与@Component的深度解析

《SpringCloud动态配置注解@RefreshScope与@Component的深度解析》在现代微服务架构中,动态配置管理是一个关键需求,本文将为大家介绍SpringCloud中相关的注解@Re... 目录引言1. @RefreshScope 的作用与原理1.1 什么是 @RefreshScope1.