Pytorch 基于im2col手动实现卷积conv2d(基于nn.Unfold实现卷积)(向量内积实现)

2023-11-07 05:59

本文主要是介绍Pytorch 基于im2col手动实现卷积conv2d(基于nn.Unfold实现卷积)(向量内积实现),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

      如果老老实实地实现卷积运算,估计要重复好几层的for语句。这样的实现有点麻烦,而且, NumPy中存在使用for语句后处理变慢的缺点(NumPy中,访问元素时最好不要用 for语句)

       如上图所示,我们每次取的input,我们可以把它拉直,拉成一个行向量。它跟kernel进行元素相乘再求和,就相当于这个输入行向量,再跟kernel的列向量(将kernel拉成列向量)进行相乘

      在上图中,为了便于观察,将步幅设置得很大,以使滤波器的应用区域不重叠。而在实际的卷积运算中,滤波器的应用区域几乎都是重叠的。在滤波器的应用区域重叠的情况下,使用im2col展开后,展开后的元素个数会多于原方块的元素个数。因此,使用im2col的实现存在比普通的实现消耗更多内存的缺点。但是,汇总成一个大的矩阵进行计算,对计算机的计算颇有益处。比如,在矩阵计算的库(线性代数库)等中,矩阵计算的实现已被高度最优化,可以高速地进行大矩阵的乘法运算。因此,通过归结到矩阵计算上,可以有效地利用线性代数库。

使用 im2col展开输入数据后,之后就只需将卷积层的kernel纵向展开为1列,并计算2个矩阵的乘积即可,如下图。

将矩阵转为列向量

x.reshape(-1,1)

代码

import torch
from torch import nn
import torch.nn.functional as F
import mathdef im2col(img, kernel_h, kernel_w, stride=1):N, C, H, W = img.shapeout_h = (H - kernel_h)//stride + 1out_w = (W - kernel_w)//stride + 1col = torch.zeros((N, C, kernel_h, kernel_w, out_h, out_w))for y in range(kernel_h):y_max = y + stride*out_hfor x in range(kernel_w):x_max = x + stride*out_wcol[:, :, y, x, :, :] = img[:, :, y:y_max:stride, x:x_max:stride]col = col.permute(0, 4, 5, 1, 2, 3).contiguous().reshape(N*out_h*out_w, -1)return coldef my_conv(input, kernel, stride=1, padding=0, bias=0):if padding > 0:input = F.pad(input, (padding,padding,padding,padding))batch_size = input.shape[0]input_h, input_w = input.shape[2:4]kernel_h, kernel_w = kernel.shape[2:4]out_channel, in_channel = kernel.shape[0:2]output_h = math.floor((input_h - kernel_h) / stride + 1)output_w = math.floor((input_w - kernel_w) / stride + 1)input_vector = im2col(input, kernel_h, kernel_w, stride=stride)kernel_vector = kernel.reshape(kernel.shape[0], -1).Toutput = input_vector @ kernel_vector + biasoutput = output.reshape(batch_size, output_h, output_w, out_channel).permute(0,3,1,2).contiguous()    #注意可不能写成下面这样# output = output.reshape(batch_size, out_channel, output_h, output_w)return outputbatch_size = 4
in_channel = 3
out_channel = 16
input = torch.rand(batch_size, in_channel ,5,5)
kernel = torch.rand(out_channel, in_channel, 3,3)
bias = torch.rand(out_channel)my_output = my_conv(input, kernel, padding=1, stride=2, bias=bias)output = F.conv2d(input, kernel, padding=1, stride=2, bias=bias)assert torch.allclose(my_output, output)

用nn.Unfold实现

import torch
from torch import nn
import torch.nn.functional as F
import mathdef my_conv(input, kernel, stride=1, padding=0, bias=0):if padding > 0:input = F.pad(input, (padding,padding,padding,padding))batch_size = input.shape[0]input_h, input_w = input.shape[2:4]kernel_h, kernel_w = kernel.shape[2:4]out_channel, in_channel = kernel.shape[0:2]output_h = math.floor((input_h - kernel_h) / stride + 1)output_w = math.floor((input_w - kernel_w) / stride + 1)unfold = nn.Unfold(kernel_size=(kernel_h, kernel_w), stride=stride)input_vector = unfold(input)kernel_vector = kernel.reshape(kernel.shape[0], -1).Toutput = (input_vector.permute(0,2,1).contiguous() @ kernel_vector ) + biasoutput = output.reshape(batch_size, output_h, output_w, out_channel).permute(0,3,1,2).contiguous()    #注意可不能写成下面这样# output = output.reshape(batch_size, out_channel, output_h, output_w)return outputbatch_size = 4
in_channel = 3
out_channel = 16
input = torch.rand(batch_size, in_channel ,5,5)
kernel = torch.rand(out_channel, in_channel, 3,3)
bias = torch.rand(out_channel)my_output = my_conv(input, kernel, padding=1, stride=2, bias=bias)output = F.conv2d(input, kernel, padding=1, stride=2, bias=bias)assert torch.allclose(my_output, output)

这篇关于Pytorch 基于im2col手动实现卷积conv2d(基于nn.Unfold实现卷积)(向量内积实现)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/361695

相关文章

C++中unordered_set哈希集合的实现

《C++中unordered_set哈希集合的实现》std::unordered_set是C++标准库中的无序关联容器,基于哈希表实现,具有元素唯一性和无序性特点,本文就来详细的介绍一下unorder... 目录一、概述二、头文件与命名空间三、常用方法与示例1. 构造与析构2. 迭代器与遍历3. 容量相关4

C++中悬垂引用(Dangling Reference) 的实现

《C++中悬垂引用(DanglingReference)的实现》C++中的悬垂引用指引用绑定的对象被销毁后引用仍存在的情况,会导致访问无效内存,下面就来详细的介绍一下产生的原因以及如何避免,感兴趣... 目录悬垂引用的产生原因1. 引用绑定到局部变量,变量超出作用域后销毁2. 引用绑定到动态分配的对象,对象

SpringBoot基于注解实现数据库字段回填的完整方案

《SpringBoot基于注解实现数据库字段回填的完整方案》这篇文章主要为大家详细介绍了SpringBoot如何基于注解实现数据库字段回填的相关方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解... 目录数据库表pom.XMLRelationFieldRelationFieldMapping基础的一些代

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java AOP面向切面编程的概念和实现方式

《JavaAOP面向切面编程的概念和实现方式》AOP是面向切面编程,通过动态代理将横切关注点(如日志、事务)与核心业务逻辑分离,提升代码复用性和可维护性,本文给大家介绍JavaAOP面向切面编程的概... 目录一、AOP 是什么?二、AOP 的核心概念与实现方式核心概念实现方式三、Spring AOP 的关

Python实现字典转字符串的五种方法

《Python实现字典转字符串的五种方法》本文介绍了在Python中如何将字典数据结构转换为字符串格式的多种方法,首先可以通过内置的str()函数进行简单转换;其次利用ison.dumps()函数能够... 目录1、使用json模块的dumps方法:2、使用str方法:3、使用循环和字符串拼接:4、使用字符

Linux云服务器手动配置DNS的方法步骤

《Linux云服务器手动配置DNS的方法步骤》在Linux云服务器上手动配置DNS(域名系统)是确保服务器能够正常解析域名的重要步骤,以下是详细的配置方法,包括系统文件的修改和常见问题的解决方案,需要... 目录1. 为什么需要手动配置 DNS?2. 手动配置 DNS 的方法方法 1:修改 /etc/res

Linux下利用select实现串口数据读取过程

《Linux下利用select实现串口数据读取过程》文章介绍Linux中使用select、poll或epoll实现串口数据读取,通过I/O多路复用机制在数据到达时触发读取,避免持续轮询,示例代码展示设... 目录示例代码(使用select实现)代码解释总结在 linux 系统里,我们可以借助 select、

Linux挂载linux/Windows共享目录实现方式

《Linux挂载linux/Windows共享目录实现方式》:本文主要介绍Linux挂载linux/Windows共享目录实现方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录文件共享协议linux环境作为服务端(NFS)在服务器端安装 NFS创建要共享的目录修改 NFS 配

通过React实现页面的无限滚动效果

《通过React实现页面的无限滚动效果》今天我们来聊聊无限滚动这个现代Web开发中不可或缺的技术,无论你是刷微博、逛知乎还是看脚本,无限滚动都已经渗透到我们日常的浏览体验中,那么,如何优雅地实现它呢?... 目录1. 早期的解决方案2. 交叉观察者:IntersectionObserver2.1 Inter