PyTorch之PixelShuffle

2024-03-15 03:59
文章标签 pytorch pixelshuffle

本文主要是介绍PyTorch之PixelShuffle,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述
这里介绍一下PyTorch中torch.nn.PixelShuffle()这个层的背景介绍和相关用法。

参考文档:
①PyTorch中的PixelShuffle

PixelShuffle层

  • 1 背景介绍
  • 2 用法简介
    • 2.1 实战代码
    • 2.2 效果展示

1 背景介绍

PixelShuffle层又名亚像素卷积层,是论文Real-Time Single Image and Video Super-Resolution Using an Efficient Sub-Pixel Convolutional Neural Network中介绍的一种应用于超分辨率重建应用的具有上采样功能的卷积层。这篇ESPCN论文介绍了这种层的功能,sub-pixel convolution layer以 s t r i d e = 1 r stride=\frac{1}{r} stride=r1( r r r为SR的放大倍数upscaling factor)去提取feature map,虽然称之为卷积,但是其并没用用到任何需要学习的参数,它的原理也很简单,就是将输入feature map进行像素重组,也就是说亚像素卷积层虽用卷积之名,但却没有做任何乘加计算,只是用了另一种方式去提取特征罢了:
在这里插入图片描述
如上图所示的最后一层就是亚像素卷积层,它就是将输入格式为 ( b a t c h , r 2 C , H , W ) (batch,r^2C, H, W) (batch,r2C,H,W)的feature map中同一通道的像素提取出来作为输出feature map的一小块,遍历整个输入feature map就可以得到最后的输出图像。整体来看,就好像是用 1 r \frac{1}{r} r1的步长去做卷积一样,这样就造成了不是对整像素点做卷积,而是对亚像素做卷积,故称之为亚像素卷积层,最后的输出格式就是 ( b a t c h , 1 , r H , r W ) (batch,1, rH,rW) (batch,1,rH,rW)
Note:

  1. 想要了解更多关于ESPCN网络或者亚像素卷积层的相关知识,请看我的另一篇论文笔记之ESPCN。
  2. 亚像素卷积是一个隐式卷积的过程,其不含任何可学习参数

因此,简单一句话,PixelShuffle层做的事情就是将输入feature map像素重组输出高分辨率的feature map,是一种上采样方法,具体表达为:
( b a t c h , r 2 C , H , W ) → ( b a t c h , 1 , r H , r W ) (batch,r^2C, H, W)\to (batch,1, rH,rW) (batch,r2C,H,W)(batch,1,rH,rW)其中 r r r为上采样倍率(上图中 r = 3 r=3 r=3)。

2 用法简介

我们来看看PyTorch是如何将ESPCN论文的核心——亚像素采样层编写出来的:
调用格式,该层的输入就是上采样倍率 r r r

torch.nn.PixelShuffle(upscale_factor=3)

内部源码如下:
在这里插入图片描述
其源码中就是3个方法:
①:init():保存上采样倍率值。
②:forward(),调用F.pixel_shuffle()函数,其实做的就是亚像素卷积层背后的重组过程,其输入就是待重组的输入feature map
③:extra_repr():打印出上采样倍率 r r r的值。

Note:

  1. torch.nn.PixelShuffle()不含任何可学习参数 W , b W,b W,b,和一般的卷积层是不一样的,尽管亚像素卷积也是一种特征提取过程。

2.1 实战代码

接下来我们实际来使用一下:
我们设置上采样倍率 r = 2 r=2 r=2,输入feature map的格式为: ( 1 , 1 , 3 , 3 ) (1, 1, 3,3) (1,1,3,3),模拟一个batch=1,通道数为1,图像高和宽为3的feature map

r = 2  # 上采样倍率
ps = nn.PixelShuffle(r)
x = torch.arange(4*9).view(1, 1*(r**2), 3, 3)
print(f'input is \n {x},and size is \n {x.size()}')
y = ps(x)  # 亚像素采样
print(f'output is \n {y},and size is \n {y.size()}')
print(f'upscale_factor is {ps.extra_repr()}')

2.2 效果展示

最后的输出如下:
在这里插入图片描述
可以很容易看出来,torch.nn.PixelShuffle()描述的就是ESPCN论文中的亚像素采样过程

这篇关于PyTorch之PixelShuffle的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/810721

相关文章

PyTorch中的词嵌入层(nn.Embedding)详解与实战应用示例

《PyTorch中的词嵌入层(nn.Embedding)详解与实战应用示例》词嵌入解决NLP维度灾难,捕捉语义关系,PyTorch的nn.Embedding模块提供灵活实现,支持参数配置、预训练及变长... 目录一、词嵌入(Word Embedding)简介为什么需要词嵌入?二、PyTorch中的nn.Em

Pytorch介绍与安装过程

《Pytorch介绍与安装过程》PyTorch因其直观的设计、卓越的灵活性以及强大的动态计算图功能,迅速在学术界和工业界获得了广泛认可,成为当前深度学习研究和开发的主流工具之一,本文给大家介绍Pyto... 目录1、Pytorch介绍1.1、核心理念1.2、核心组件与功能1.3、适用场景与优势总结1.4、优

conda安装GPU版pytorch默认却是cpu版本

《conda安装GPU版pytorch默认却是cpu版本》本文主要介绍了遇到Conda安装PyTorchGPU版本却默认安装CPU的问题,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的... 目录一、问题描述二、网上解决方案罗列【此节为反面方案罗列!!!】三、发现的根本原因[独家]3.1 p

PyTorch中cdist和sum函数使用示例详解

《PyTorch中cdist和sum函数使用示例详解》torch.cdist是PyTorch中用于计算**两个张量之间的成对距离(pairwisedistance)**的函数,常用于点云处理、图神经网... 目录基本语法输出示例1. 简单的 2D 欧几里得距离2. 批量形式(3D Tensor)3. 使用不

PyTorch高级特性与性能优化方式

《PyTorch高级特性与性能优化方式》:本文主要介绍PyTorch高级特性与性能优化方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、自动化机制1.自动微分机制2.动态计算图二、性能优化1.内存管理2.GPU加速3.多GPU训练三、分布式训练1.分布式数据

判断PyTorch是GPU版还是CPU版的方法小结

《判断PyTorch是GPU版还是CPU版的方法小结》PyTorch作为当前最流行的深度学习框架之一,支持在CPU和GPU(NVIDIACUDA)上运行,所以对于深度学习开发者来说,正确识别PyTor... 目录前言为什么需要区分GPU和CPU版本?性能差异硬件要求如何检查PyTorch版本?方法1:使用命

pytorch自动求梯度autograd的实现

《pytorch自动求梯度autograd的实现》autograd是一个自动微分引擎,它可以自动计算张量的梯度,本文主要介绍了pytorch自动求梯度autograd的实现,具有一定的参考价值,感兴趣... autograd是pytorch构建神经网络的核心。在 PyTorch 中,结合以下代码例子,当你

在PyCharm中安装PyTorch、torchvision和OpenCV详解

《在PyCharm中安装PyTorch、torchvision和OpenCV详解》:本文主要介绍在PyCharm中安装PyTorch、torchvision和OpenCV方式,具有很好的参考价值,... 目录PyCharm安装PyTorch、torchvision和OpenCV安装python安装PyTor

pytorch之torch.flatten()和torch.nn.Flatten()的用法

《pytorch之torch.flatten()和torch.nn.Flatten()的用法》:本文主要介绍pytorch之torch.flatten()和torch.nn.Flatten()的用... 目录torch.flatten()和torch.nn.Flatten()的用法下面举例说明总结torch

使用PyTorch实现手写数字识别功能

《使用PyTorch实现手写数字识别功能》在人工智能的世界里,计算机视觉是最具魅力的领域之一,通过PyTorch这一强大的深度学习框架,我们将在经典的MNIST数据集上,见证一个神经网络从零开始学会识... 目录当计算机学会“看”数字搭建开发环境MNIST数据集解析1. 认识手写数字数据库2. 数据预处理的