Trans高质量Paper | 再小再隐蔽的目标检测都不是问题(附源码下载)

2024-03-11 20:30

本文主要是介绍Trans高质量Paper | 再小再隐蔽的目标检测都不是问题(附源码下载),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!


计算机视觉研究院专栏

作者:Edison_G

隐藏的目标与背景之间的高内在相似性使得COD(concealed object detection)比传统的目标检测/分割更具挑战性。

长按扫描二维码关注我们

一、简要

有研究者提出第一个关于隐藏物体检测的系统研究,旨在识别那些“完美嵌入”在其背景中的物体。隐藏的目标与背景之间的高内在相似性使得COD比传统的对象检测/分割更具挑战性。

为了更好地理解这项任务,收集了一个叫做COD10K的大型数据集(如上图),它由10,000张图像组成,覆盖了78个目标类别中不同真实场景中隐藏的目标。此外,研究者还提供了丰富的注释,包括目标类别、目标边界、具有挑战性的属性、目标级标签和实例级注释。

COD10K是迄今为止最大的COD数据集,具有最丰富的注释,它支持全面的隐藏目标理解,甚至可以用来帮助推进其他一些视觉任务,如检测、分割、分类等。受动物在野外狩猎的启发,研究者还为COD设计了一个简单而强大的基线,称为搜索识别网络(Search Identification Network,SINet)。在没有任何bells和whistles情况下,SINet在所有被测试的数据集上的性能都超过了12个前沿基线,使它们成为鲁棒的通用架构,可以作为COD未来研究的催化剂。

二、背景

您是否可以在上图中10秒内找到隐藏的目标吗?生物学家称其称为背景匹配伪装(BMC),其中一个或多个物体试图调整其颜色以与周围环境“无缝”匹配,以避免检测到。生态学家发现,这种BMC策略可以欺骗观察者的视觉感知系统。自然地,隐藏目标检测(COD)需要大量的视觉感知知识。理解COD本身不仅具有科学价值,而且在许多基本领域的应用也很重要,如计算机视觉(例如,搜救工作或稀有物种发现)、医学(例如,息肉分割、肺感染分割)、农业(例如,防止入侵的蝗虫检测)和艺术(例如,recreational art)。

在下图中提供了通用、突出和隐藏目标检测的例子。

目标和非目标之间的高内在相似性使得COD比传统的目标分割/检测更具挑战性。尽管最近受到了越来越多的关注,但关于COD的研究仍然很少,主要是由于缺乏足够大的数据集和标准基准,如Pascal-VOC, ImageNet, MS-COCO, ADE20K和DAVIS。 

三、COD10K DATASET

Object and instance distributions of each concealed category in the COD10K

Diverse types of concealed objects in our COD10K

四、COD FRAMEWORK

Component details

Group-Reversal Attention (GRA)。最后在反向指导和小组指导操作的帮助下,引入了剩余的学习过程,称为GRA块。根据以往的研究,多阶段的细化可以提高性能。

五、实验

计算机视觉研究院学习群等你加入!

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

扫码关注

计算机视觉研究院

公众号ID|ComputerVisionGzq

学习群|扫码在主页获取加入方式

Githu代码 | 回复“COD”获取代码

这篇关于Trans高质量Paper | 再小再隐蔽的目标检测都不是问题(附源码下载)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/798978

相关文章

线上Java OOM问题定位与解决方案超详细解析

《线上JavaOOM问题定位与解决方案超详细解析》OOM是JVM抛出的错误,表示内存分配失败,:本文主要介绍线上JavaOOM问题定位与解决方案的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录一、OOM问题核心认知1.1 OOM定义与技术定位1.2 OOM常见类型及技术特征二、OOM问题定位工具

Vue3绑定props默认值问题

《Vue3绑定props默认值问题》使用Vue3的defineProps配合TypeScript的interface定义props类型,并通过withDefaults设置默认值,使组件能安全访问传入的... 目录前言步骤步骤1:使用 defineProps 定义 Props步骤2:设置默认值总结前言使用T

Web服务器-Nginx-高并发问题

《Web服务器-Nginx-高并发问题》Nginx通过事件驱动、I/O多路复用和异步非阻塞技术高效处理高并发,结合动静分离和限流策略,提升性能与稳定性... 目录前言一、架构1. 原生多进程架构2. 事件驱动模型3. IO多路复用4. 异步非阻塞 I/O5. Nginx高并发配置实战二、动静分离1. 职责2

解决升级JDK报错:module java.base does not“opens java.lang.reflect“to unnamed module问题

《解决升级JDK报错:modulejava.basedoesnot“opensjava.lang.reflect“tounnamedmodule问题》SpringBoot启动错误源于Jav... 目录问题描述原因分析解决方案总结问题描述启动sprintboot时报以下错误原因分析编程异js常是由Ja

MySQL 表空却 ibd 文件过大的问题及解决方法

《MySQL表空却ibd文件过大的问题及解决方法》本文给大家介绍MySQL表空却ibd文件过大的问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录一、问题背景:表空却 “吃满” 磁盘的怪事二、问题复现:一步步编程还原异常场景1. 准备测试源表与数据

解决Nginx启动报错Job for nginx.service failed because the control process exited with error code问题

《解决Nginx启动报错Jobfornginx.servicefailedbecausethecontrolprocessexitedwitherrorcode问题》Nginx启... 目录一、报错如下二、解决原因三、解决方式总结一、报错如下Job for nginx.service failed bec

SysMain服务可以关吗? 解决SysMain服务导致的高CPU使用率问题

《SysMain服务可以关吗?解决SysMain服务导致的高CPU使用率问题》SysMain服务是超级预读取,该服务会记录您打开应用程序的模式,并预先将它们加载到内存中以节省时间,但它可能占用大量... 在使用电脑的过程中,CPU使用率居高不下是许多用户都遇到过的问题,其中名为SysMain的服务往往是罪魁

Python多线程实现大文件快速下载的代码实现

《Python多线程实现大文件快速下载的代码实现》在互联网时代,文件下载是日常操作之一,尤其是大文件,然而,网络条件不稳定或带宽有限时,下载速度会变得很慢,本文将介绍如何使用Python实现多线程下载... 目录引言一、多线程下载原理二、python实现多线程下载代码说明:三、实战案例四、注意事项五、总结引

MySQ中出现幻读问题的解决过程

《MySQ中出现幻读问题的解决过程》文章解析MySQLInnoDB通过MVCC与间隙锁机制在可重复读隔离级别下解决幻读,确保事务一致性,同时指出性能影响及乐观锁等替代方案,帮助开发者优化数据库应用... 目录一、幻读的准确定义与核心特征幻读 vs 不可重复读二、mysql隔离级别深度解析各隔离级别的实现差异

C++ vector越界问题的完整解决方案

《C++vector越界问题的完整解决方案》在C++开发中,std::vector作为最常用的动态数组容器,其便捷性与性能优势使其成为处理可变长度数据的首选,然而,数组越界访问始终是威胁程序稳定性的... 目录引言一、vector越界的底层原理与危害1.1 越界访问的本质原因1.2 越界访问的实际危害二、基