PyTorch模型参数量计算【使用torchsummary库与自定义 两种方法!附完整代码!!】

本文主要是介绍PyTorch模型参数量计算【使用torchsummary库与自定义 两种方法!附完整代码!!】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

深度学习PyTorch模型参数量计算示例

在深度学习中,有时候处于分析模型的需要或者写文章的需要,得到模型的参数量对于理解模型复杂度、进行内存管理以及模型优化都至关重要。PyTorch作为当前流行的深度学习框架,为我们提供了计算模型参数量的工具和方法。下面将通过两个示例,详细展示如何在PyTorch中计算模型的参数量。

示例一:基础模型参数量计算

首先,我们创建一个简单的PyTorch模型,该模型包含一个卷积层、一个ReLU激活函数层和一个全连接层。然后,我们将使用PyTorch的torchsummary库来计算模型的参数量。

import torch
import torch.nn as nn
from torchsummary import summary# 定义一个示例模型
class ExampleModel(nn.Module):def __init__(self):super(ExampleModel, self).__init__()self.conv1 = nn.Conv2d(3, 16, 3, padding=1)self.conv2 = nn.Conv2d(16, 32, 3, padding=1)self.fc = nn.Linear(32 * 8 * 8, 10)def forward(self, x1, x2, x3):# 处理第一个图像x = torch.relu(self.conv1(x1))x = torch.relu(self.conv2(x))x = x.view(-1, 32 * 8 * 8)x = self.fc(x)# 处理第二个图像y = torch.relu(self.conv1(x2))y = torch.relu(self.conv2(y))y = y.view(-1, 32 * 8 * 8)y = self.fc(y)# 处理第三个图像z = torch.relu(self.conv1(x3))z = torch.relu(self.conv2(z))z = z.view(-1, 32 * 8 * 8)z = self.fc(z)return x, y, z# 创建一个示例模型实例
model = ExampleModel()# 将模型移动到 CUDA 设备上
device = torch.device('cuda')
model.to(device)# 模拟输入,假设每张图像大小为 3x32x32
image1 = torch.randn(1, 3, 32, 32).to(device)
image2 = torch.randn(1, 3, 32, 32).to(device)
image3 = torch.randn(1, 3, 32, 32).to(device)# 打印模型摘要
summary(model, [(3, 32, 32), (3, 32, 32), (3, 32, 32)])  # 传递每个图像的输入大小

在上面的代码中,我们首先定义了一个简单的示例模型ExampleModel,然后使用torchsummary库的summary函数来计算模型的参数量。summary函数需要两个参数:模型实例和输入数据的形状。执行这段代码后,将会输出模型的每一层的详细信息,包括输出大小、参数量等。
在这里插入图片描述

示例二:自定义函数计算参数量

除了使用torchsummary库,我们还可以自定义一个函数来计算模型的参数量。这样做的好处是更加灵活,可以根据需要定制输出信息。

import torch
import torch.nn as nn# 定义一个示例模型
class ExampleModel(nn.Module):def __init__(self):super(ExampleModel, self).__init__()self.conv1 = nn.Conv2d(3, 16, 3, padding=1)self.conv2 = nn.Conv2d(16, 32, 3, padding=1)self.fc = nn.Linear(32 * 8 * 8, 10)def forward(self, x):x = torch.relu(self.conv1(x))x = torch.relu(self.conv2(x))x = x.view(-1, 32 * 8 * 8)x = self.fc(x)return x# 创建一个示例模型实例
model = ExampleModel()# 计算模型参数大小
total_params = sum(p.numel() for p in model.parameters())
print("Total parameters:", total_params)

在这个示例中,我们定义了一个sum(p.numel() for p in model.parameters())操作,它遍历模型的所有参数,并计算需要梯度的参数的总数。numel()函数返回张量中的元素总数。最后,我们打印出模型的参数量。
在这里插入图片描述

总结

通过以上两个示例,我们展示了如何在PyTorch中计算模型的参数量。第一个示例使用了torchsummary库,它提供了详细的模型层信息以及参数量的统计;第二个示例则通过自定义函数来实现参数量的计算,更加灵活可控。在实际项目中,大家根据具体需求选择合适的方法来计算模型参数量,有助于更好地理解和优化模型。

版权声明

本博客内容仅供学习交流,转载请注明出处。

这篇关于PyTorch模型参数量计算【使用torchsummary库与自定义 两种方法!附完整代码!!】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/945453

相关文章

Java 枚举的基本使用方法及实际使用场景

《Java枚举的基本使用方法及实际使用场景》枚举是Java中一种特殊的类,用于定义一组固定的常量,枚举类型提供了更好的类型安全性和可读性,适用于需要定义一组有限且固定的值的场景,本文给大家介绍Jav... 目录一、什么是枚举?二、枚举的基本使用方法定义枚举三、实际使用场景代替常量状态机四、更多用法1.实现接

python获取cmd环境变量值的实现代码

《python获取cmd环境变量值的实现代码》:本文主要介绍在Python中获取命令行(cmd)环境变量的值,可以使用标准库中的os模块,需要的朋友可以参考下... 前言全局说明在执行py过程中,总要使用到系统环境变量一、说明1.1 环境:Windows 11 家庭版 24H2 26100.4061

java String.join()方法实例详解

《javaString.join()方法实例详解》String.join()是Java提供的一个实用方法,用于将多个字符串按照指定的分隔符连接成一个字符串,这一方法是Java8中引入的,极大地简化了... 目录bVARxMJava String.join() 方法详解1. 方法定义2. 基本用法2.1 拼接

java连接opcua的常见问题及解决方法

《java连接opcua的常见问题及解决方法》本文将使用EclipseMilo作为示例库,演示如何在Java中使用匿名、用户名密码以及证书加密三种方式连接到OPCUA服务器,若需要使用其他SDK,原理... 目录一、前言二、准备工作三、匿名方式连接3.1 匿名方式简介3.2 示例代码四、用户名密码方式连接4

springboot项目中使用JOSN解析库的方法

《springboot项目中使用JOSN解析库的方法》JSON,全程是JavaScriptObjectNotation,是一种轻量级的数据交换格式,本文给大家介绍springboot项目中使用JOSN... 目录一、jsON解析简介二、Spring Boot项目中使用JSON解析1、pom.XML文件引入依

Java中的record使用详解

《Java中的record使用详解》record是Java14引入的一种新语法(在Java16中成为正式功能),用于定义不可变的数据类,这篇文章给大家介绍Java中的record相关知识,感兴趣的朋友... 目录1. 什么是 record?2. 基本语法3. record 的核心特性4. 使用场景5. 自定

IDEA中Maven Dependencies出现红色波浪线的原因及解决方法

《IDEA中MavenDependencies出现红色波浪线的原因及解决方法》在使用IntelliJIDEA开发Java项目时,尤其是基于Maven的项目,您可能会遇到MavenDependenci... 目录一、问题概述二、解决步骤2.1 检查 Maven 配置2.2 更新 Maven 项目2.3 清理本

Python使用Tkinter打造一个完整的桌面应用

《Python使用Tkinter打造一个完整的桌面应用》在Python生态中,Tkinter就像一把瑞士军刀,它没有花哨的特效,却能快速搭建出实用的图形界面,作为Python自带的标准库,无需安装即可... 目录一、界面搭建:像搭积木一样组合控件二、菜单系统:给应用装上“控制中枢”三、事件驱动:让界面“活”

pandas实现数据concat拼接的示例代码

《pandas实现数据concat拼接的示例代码》pandas.concat用于合并DataFrame或Series,本文主要介绍了pandas实现数据concat拼接的示例代码,具有一定的参考价值,... 目录语法示例:使用pandas.concat合并数据默认的concat:参数axis=0,join=

java中BigDecimal里面的subtract函数介绍及实现方法

《java中BigDecimal里面的subtract函数介绍及实现方法》在Java中实现减法操作需要根据数据类型选择不同方法,主要分为数值型减法和字符串减法两种场景,本文给大家介绍java中BigD... 目录Java中BigDecimal里面的subtract函数的意思?一、数值型减法(高精度计算)1.