深度学习之图像分割(三)—— 空洞卷积/膨胀卷积(霹雳吧啦wz)

2024-02-22 07:20

本文主要是介绍深度学习之图像分割(三)—— 空洞卷积/膨胀卷积(霹雳吧啦wz),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

    • 引入空洞卷积
      • 1.空洞卷积的优缺点:
        • 1.空洞卷积的优点
        • 2.空洞卷积的缺点
      • 2.Gridding effect:网格影响
      • 3.解决办法:Hybrid Dilated Convolution(HDC)
      • 4.在连续使用多个膨胀卷积时,该如何设置膨胀系数?
        • 方法1.使用公式验证膨胀系数的大小
        • 方法2.将膨胀系数设置成锯齿结构
        • 方法3.膨胀系数的公约数不能大于1
      • 5.对比实验
      • 6.反卷积计算公式

引入空洞卷积

1.空洞卷积的优缺点:

1.空洞卷积的优点

1.增大感受野:传统的下采样虽可增加感受野,但会降低空间分辨率。而使用空洞卷积能够在扩大感受野的同时,保证分辨率。这十分适用于检测、分割任务中,感受野的增大可检测、分割大的目标,高分辨率则可精确定位目标。
2.保持原输入特征图W、H(一般通过padding)
3.捕获多尺度上下文信息:空洞卷积中参数 dilation rate 表明在卷积核中填充 (dilation rate-1) 个 0。设置不同 dilation rate 给网络带来不同的感受野,即获取了多尺度信息。
在这里插入图片描述

2.空洞卷积的缺点

1.局部信息丢失:由于空洞卷积的计算方式类似于棋盘格式,某一层得到的卷积结果,来自上一层的独立的集合,没有相互依赖,因此该层的卷积结果之间没有相关性,即局部信息丢失;
2.远距离获取的信息没有相关性:由于空洞卷积稀疏的采样输入信号,使得远距离卷积得到的信息之间没有相关性。

2.Gridding effect:网格影响

Gridding effect:没有用到范围内的所有像素值,而只使用到了一部分。非零元素中间有0元素(没有使用到的元素),因此一定会失去一部分信息。
在这里插入图片描述
在这里插入图片描述

3.解决办法:Hybrid Dilated Convolution(HDC)

连续使用膨胀卷积时,膨胀系数不同。感受野13*13
在这里插入图片描述
对比普通卷积,可以看到感受野明显减小了很多,感受野7*7
在这里插入图片描述

4.在连续使用多个膨胀卷积时,该如何设置膨胀系数?

方法1.使用公式验证膨胀系数的大小

在这里插入图片描述
Mi就等于第i层两个非零元素之间的距离,ri就等于第i层的膨胀系数。我们的目标是M2≤K。根据三个膨胀系数,计算值是否合适。

方法2.将膨胀系数设置成锯齿结构

在这里插入图片描述

方法3.膨胀系数的公约数不能大于1

在这里插入图片描述

5.对比实验

第二行是没有使用HDC方法,第三行是使用了HDC
在这里插入图片描述

6.反卷积计算公式

假设输入特征图的尺寸为 H i n × W i n × C i n H_{in} \times W_{in} \times C_{in} Hin×Win×Cin,输出特征图的尺寸为 H o u t × W o u t × C o u t H_{out} \times W_{out} \times C_{out} Hout×Wout×Cout,上采样倍数为 k k k,膨胀卷积核大小为 k h × k w k_h \times k_w kh×kw,填充大小为 p h × p w p_h \times p_w ph×pw,跨度为 s h × s w s_h \times s_w sh×sw,则膨胀卷积的系数计算如下:

计算输出特征图的尺寸:
H o u t = ( H i n − 1 ) × s h + k h − 2 × p h H_{out} = (H_{in} - 1) \times s_h + k_h - 2 \times p_h Hout=(Hin1)×sh+kh2×ph

W o u t = ( W i n − 1 ) × s w + k w − 2 × p w W_{out} = (W_{in} - 1) \times s_w + k_w - 2 \times p_w Wout=(Win1)×sw+kw2×pw

这篇关于深度学习之图像分割(三)—— 空洞卷积/膨胀卷积(霹雳吧啦wz)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/734502

相关文章

Go学习记录之runtime包深入解析

《Go学习记录之runtime包深入解析》Go语言runtime包管理运行时环境,涵盖goroutine调度、内存分配、垃圾回收、类型信息等核心功能,:本文主要介绍Go学习记录之runtime包的... 目录前言:一、runtime包内容学习1、作用:① Goroutine和并发控制:② 垃圾回收:③ 栈和

Python中文件读取操作漏洞深度解析与防护指南

《Python中文件读取操作漏洞深度解析与防护指南》在Web应用开发中,文件操作是最基础也最危险的功能之一,这篇文章将全面剖析Python环境中常见的文件读取漏洞类型,成因及防护方案,感兴趣的小伙伴可... 目录引言一、静态资源处理中的路径穿越漏洞1.1 典型漏洞场景1.2 os.path.join()的陷

Android学习总结之Java和kotlin区别超详细分析

《Android学习总结之Java和kotlin区别超详细分析》Java和Kotlin都是用于Android开发的编程语言,它们各自具有独特的特点和优势,:本文主要介绍Android学习总结之Ja... 目录一、空安全机制真题 1:Kotlin 如何解决 Java 的 NullPointerExceptio

Python中OpenCV与Matplotlib的图像操作入门指南

《Python中OpenCV与Matplotlib的图像操作入门指南》:本文主要介绍Python中OpenCV与Matplotlib的图像操作指南,本文通过实例代码给大家介绍的非常详细,对大家的学... 目录一、环境准备二、图像的基本操作1. 图像读取、显示与保存 使用OpenCV操作2. 像素级操作3.

C/C++的OpenCV 进行图像梯度提取的几种实现

《C/C++的OpenCV进行图像梯度提取的几种实现》本文主要介绍了C/C++的OpenCV进行图像梯度提取的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录预www.chinasem.cn备知识1. 图像加载与预处理2. Sobel 算子计算 X 和 Y

c/c++的opencv图像金字塔缩放实现

《c/c++的opencv图像金字塔缩放实现》本文主要介绍了c/c++的opencv图像金字塔缩放实现,通过对原始图像进行连续的下采样或上采样操作,生成一系列不同分辨率的图像,具有一定的参考价值,感兴... 目录图像金字塔简介图像下采样 (cv::pyrDown)图像上采样 (cv::pyrUp)C++ O

c/c++的opencv实现图片膨胀

《c/c++的opencv实现图片膨胀》图像膨胀是形态学操作,通过结构元素扩张亮区填充孔洞、连接断开部分、加粗物体,OpenCV的cv::dilate函数实现该操作,本文就来介绍一下opencv图片... 目录什么是图像膨胀?结构元素 (KerChina编程nel)OpenCV 中的 cv::dilate() 函

Spring Boot拦截器Interceptor与过滤器Filter深度解析(区别、实现与实战指南)

《SpringBoot拦截器Interceptor与过滤器Filter深度解析(区别、实现与实战指南)》:本文主要介绍SpringBoot拦截器Interceptor与过滤器Filter深度解析... 目录Spring Boot拦截器(Interceptor)与过滤器(Filter)深度解析:区别、实现与实

MyBatis分页插件PageHelper深度解析与实践指南

《MyBatis分页插件PageHelper深度解析与实践指南》在数据库操作中,分页查询是最常见的需求之一,传统的分页方式通常有两种内存分页和SQL分页,MyBatis作为优秀的ORM框架,本身并未提... 目录1. 为什么需要分页插件?2. PageHelper简介3. PageHelper集成与配置3.

Maven 插件配置分层架构深度解析

《Maven插件配置分层架构深度解析》:本文主要介绍Maven插件配置分层架构深度解析,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考下吧... 目录Maven 插件配置分层架构深度解析引言:当构建逻辑遇上复杂配置第一章 Maven插件配置的三重境界1.1 插件配置的拓扑