COCO 54.7mAP 开源DetectoRS:使用递归特征金字塔检测对象和可切换的Atrous卷积

本文主要是介绍COCO 54.7mAP 开源DetectoRS:使用递归特征金字塔检测对象和可切换的Atrous卷积,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

作者信息

 

第一作者Siyuan Qiao目前是约翰霍普金斯大学的博士生,第二作者是著名的DeepLab系列算法的主要作者、谷歌公司的研究员Liang-Chieh Chen。

 

在COCO数据集的实例分割和全景分割任务中,DetectoRS,成为当前目标检测、语义分割和全景分割领域的全能者。

 

介绍

在本文中,作者探索了用于目标检测的主干设计中的这种机制。在宏级别提出了递归特征金字塔,它结合了从特征金字塔网络到自下而上的骨干层的额外反馈连接。在微观层面上,作者又提出了可切换的Atrous卷积,它以不同的atrous速率对特征进行卷积,并使用switch函数收集结果。将它们组合在一起将产生DetectoRS,这将大大提高对象检测的性能。在COCO测试开发中,DetectoRS达到了用于对象检测的54.7%的盒式AP,用于实例分割的47.1%的遮罩AP和用于全景分割的49.6%的PQ。 

 

架构思想

检测器的思想来源于Faster RCNN 、Cascade R-CNN等成功的目标检测算法的思想:三思而后行(无论是两级检测器还是级联检测器,都反映了信息的重复使用和细化),将此思想应用于骨干网的改进。主要创新点如图所示:

图1:(a)我们的递归特征金字塔添加了从上至下FPN层到自下而上骨干层的反馈连接(实线),以查看图像两次或更多次。(b)我们的可切换原子卷积在具有不同原子速率的输入特征上查看两次,并且通过开关将输出组合在一起。

 

  • 在宏层次上,提出了一种递归特征金字塔网络(RFP,recursive feature pyramid),它将FPN的反馈信息集成到骨干网络上,使骨干网络重新训练的特征能够更好地适应检测或分割任务。

  • 在微观层次上,提出了用可切换的阿托洛斯卷积(SAC)来代替骨干网络上的标准卷积,使模型能够自适应地选择接收场。

 

递归特征金字塔网络(RFP)

 

众所周知的特征金字塔网络(FPN)是将骨干网不同阶段的特征金字塔形成一个特征金字塔,如下(a)所示,RFP为骨干网增加目标检测任务的梯度,如下图(B)所示。

图2:递归特征金字塔(RFP)的体系结构。(a)功能金字塔网络(FPN)。(b)我们的RFP包含将反馈连接到FPN。(c)RFP展开到两步顺序网络。

 

  • 反馈连接网络

图3:RFP将变换后的功能添加到Re的每个阶段

 

  • RPN中的融合模块:

图4:RFP中使用的融合模块。σ是输出Sigmoid,用于融合来自不同步骤的特征

 


可切换的空洞卷积

 

空心卷积可以增加网络的接收场,这已被证明是有效的检测和分割任务。

作者提出的可切换的Atrous卷积使网络训练尺度的选择更加灵活,如下图所示:

不同空穴率的空卷积捕获不同接收场的目标,网络可以学习一个开关,自适应地调整选择接收场的卷积结果。

网络结构如下图所示:

图4:可切换的Atrous卷积(SAC)。我们将主干网ResNet中的每个3x3卷积层都转换SAC,从而在不同的空率之间软切换卷积计算。锁指示权重为除可训练的差异外,其他均相同。

 

实验结果

作者在实验中对上述两项改进进行了评估。

图6:比较HTC,“ HTC + RFP”的培训损失,“ HTC + SAC”和DetectoRS在12个训练时期内。

 


可以看出,HTC算法+RFP或HTC+SAC的精度有了较大的提高,相比之下,HTC+SAC的改进更大,而加入RFP和SAC的精度最高。

 

下图显示了DetectoRS使用不同类型骨干网和其他SOTA算法的检测者的比较:

表1:在COCO test-dev上用于边界框对象检测的最新技术比较。TTA:测试时间增加,包括多尺度测试,水平翻转等。不带TTA的DetectoRS的输入大小为(1333,800)。mstrain:多尺度训练。

利用ResNeXt-101-32x4d骨干网,detectors在单尺度和多尺度上实现了COCO目标检测的最高精度,分别达到53.3mAP和54.7mAP

表5:在COCO test-dev上的实例细分比较。mstrain:多尺度训练。

结论

在本文中,基于“三思而后行”的设计理念,作者提出了DetectoRS。包括递归特征金字塔和可切换Atrous卷积。递归特征金字塔在宏级别(FPN的输出)实现了两次思考被带回到自下而上的骨干网的每个阶段通过反馈连接。可切换的Atrous卷积实例化了微观级别的两次,其中输入以两种不同的圆规速率进行卷积。在COCO上对DetectoRS进行了对象实例检测测试分割和全景分割都有非常优秀得表现。

 

论文地址:

https://arxiv.org/pdf/2006.02334.pdf

代码地址:

https://github.com/joe-siyuan-qiao/DetectoRS

 

 

更多论文地址源码地址:关注“图像算法”微信公众号

这篇关于COCO 54.7mAP 开源DetectoRS:使用递归特征金字塔检测对象和可切换的Atrous卷积的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/405218

相关文章

Python中模块graphviz使用入门

《Python中模块graphviz使用入门》graphviz是一个用于创建和操作图形的Python库,本文主要介绍了Python中模块graphviz使用入门,具有一定的参考价值,感兴趣的可以了解一... 目录1.安装2. 基本用法2.1 输出图像格式2.2 图像style设置2.3 属性2.4 子图和聚

windows和Linux使用命令行计算文件的MD5值

《windows和Linux使用命令行计算文件的MD5值》在Windows和Linux系统中,您可以使用命令行(终端或命令提示符)来计算文件的MD5值,文章介绍了在Windows和Linux/macO... 目录在Windows上:在linux或MACOS上:总结在Windows上:可以使用certuti

CentOS和Ubuntu系统使用shell脚本创建用户和设置密码

《CentOS和Ubuntu系统使用shell脚本创建用户和设置密码》在Linux系统中,你可以使用useradd命令来创建新用户,使用echo和chpasswd命令来设置密码,本文写了一个shell... 在linux系统中,你可以使用useradd命令来创建新用户,使用echo和chpasswd命令来设

Python使用Matplotlib绘制3D曲面图详解

《Python使用Matplotlib绘制3D曲面图详解》:本文主要介绍Python使用Matplotlib绘制3D曲面图,在Python中,使用Matplotlib库绘制3D曲面图可以通过mpl... 目录准备工作绘制简单的 3D 曲面图绘制 3D 曲面图添加线框和透明度控制图形视角Matplotlib

Pandas中统计汇总可视化函数plot()的使用

《Pandas中统计汇总可视化函数plot()的使用》Pandas提供了许多强大的数据处理和分析功能,其中plot()函数就是其可视化功能的一个重要组成部分,本文主要介绍了Pandas中统计汇总可视化... 目录一、plot()函数简介二、plot()函数的基本用法三、plot()函数的参数详解四、使用pl

使用Python实现IP地址和端口状态检测与监控

《使用Python实现IP地址和端口状态检测与监控》在网络运维和服务器管理中,IP地址和端口的可用性监控是保障业务连续性的基础需求,本文将带你用Python从零打造一个高可用IP监控系统,感兴趣的小伙... 目录概述:为什么需要IP监控系统使用步骤说明1. 环境准备2. 系统部署3. 核心功能配置系统效果展

使用Java将各种数据写入Excel表格的操作示例

《使用Java将各种数据写入Excel表格的操作示例》在数据处理与管理领域,Excel凭借其强大的功能和广泛的应用,成为了数据存储与展示的重要工具,在Java开发过程中,常常需要将不同类型的数据,本文... 目录前言安装免费Java库1. 写入文本、或数值到 Excel单元格2. 写入数组到 Excel表格

redis中使用lua脚本的原理与基本使用详解

《redis中使用lua脚本的原理与基本使用详解》在Redis中使用Lua脚本可以实现原子性操作、减少网络开销以及提高执行效率,下面小编就来和大家详细介绍一下在redis中使用lua脚本的原理... 目录Redis 执行 Lua 脚本的原理基本使用方法使用EVAL命令执行 Lua 脚本使用EVALSHA命令

Java 中的 @SneakyThrows 注解使用方法(简化异常处理的利与弊)

《Java中的@SneakyThrows注解使用方法(简化异常处理的利与弊)》为了简化异常处理,Lombok提供了一个强大的注解@SneakyThrows,本文将详细介绍@SneakyThro... 目录1. @SneakyThrows 简介 1.1 什么是 Lombok?2. @SneakyThrows

使用Python和Pyecharts创建交互式地图

《使用Python和Pyecharts创建交互式地图》在数据可视化领域,创建交互式地图是一种强大的方式,可以使受众能够以引人入胜且信息丰富的方式探索地理数据,下面我们看看如何使用Python和Pyec... 目录简介Pyecharts 简介创建上海地图代码说明运行结果总结简介在数据可视化领域,创建交互式地