目标检测:NMS代码

2024-06-17 20:36
文章标签 代码 目标 检测 nms

本文主要是介绍目标检测:NMS代码,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

非极大值抑制NMS是目标检测常用的后处理算法,用于剔除冗余检测框

总体概要:

对NMS进行分类,大致可分为以下六种,这里是依据它们在各自论文中的核心论点进行分类,这些算法可以同时属于多种类别。

  1. 分类优先:传统NMS,Soft-NMS (ICCV 2017)

  2. 定位优先:IoU-Guided NMS (ECCV 2018)

  3. 加权平均:Weighted NMS (ICME Workshop 2017)

  4. 方差加权平均:Softer-NMS (CVPR 2019)

  5. 自适应阈值:Adaptive NMS (CVPR 2019)

  6. +中心点距离:DIoU-NMS (AAAI 2020)

分类优先

传统NMS有多个名称,据不完全统计可以被称为:Traditional / Original / Standard / Greedy NMS,为统一起见,下称Traditional NMS。

Traditional NMS算法是最为经典的版本,伪代码如下:

缺点:

  1. 顺序处理的模式,计算IoU拖累了运算效率。

  2. 剔除机制太严格,依据NMS阈值暴力剔除。

  3. 阈值是经验选取的。

  4. 评判标准是IoU,即只考虑两个框的重叠面积,这对描述box重叠关系或许不够全面

测试图片

假如有如下 预测框

import cv2img = cv2.imread('./cat&dog.png')boxes = [(140,110,500,800),(110,70,550,810),(260,60,600,780),(620,80,990,780),(710,62,1050,760),(780,120,1100,740)]colors = [(255,255,0),(0,255,255),(0,255,0),(255,0,0),(255,0,255),(0,0,255)]labels = ['dog']*3 + ['cat']*3for index,(box,color) in enumerate(zip(boxes,colors)):x1,y1,x2,y2 = boxcv2.rectangle(img,(x1,y1),(x2,y2),color,2)cv2.putText(img, labels[index], (x1,y1-10), cv2.FONT_HERSHEY_SIMPLEX, 0.8, color, 2)cv2.imshow('img',img)
cv2.waitKey(20000)
cv2.destroyAllWindows()

 

 

nms实现逻辑是什么?

非极大值抑制(Non-Maximum Suppression,NMS)是一种常用于目标检测中的技术,用于消除重叠的目标框并保留置信度最高的目标框。其实现逻辑如下:

1.输入阶段: 对于每个检测到的目标框,包括其坐标(左上角和右下角)和置信度(confidence score)。

2.根据置信度排序: 首先,根据目标框的置信度对所有检测到的目标框进行排序,通常是按照置信度从高到低的顺序排列。

3.初始化空列表: 创建一个空列表,用于存储最终保留的目标框。

4.遍历目标框: 从置信度最高的目标框开始,遍历每个目标框。

5.计算重叠面积: 对于当前遍历到的目标框,计算它与之前已经保留的目标框之间的重叠面积(通常使用交并比(Intersection over Union,IoU)来衡量)。

6.剔除重叠目标框: 如果当前目标框与任何已经保留的目标框的重叠面积大于预先设定的阈值(通常为一个较小的值,如0.5),则将其剔除,否则将其保留。

7.重复此过程: 继续遍历剩余的目标框,重复上述步骤,直到所有目标框都被处理。

8.输出结果: 最终输出被保留下来的目标框,这些目标框不会与其他目标框重叠太多。

NMS 的核心思想是通过逐步筛选,去除与置信度最高的目标框有较大重叠的其他目标框,从而保留最具代表性和置信度最高的目标框。这样可以减少冗余的检测结果,提高目标检测算法的准确性和效率。

这篇关于目标检测:NMS代码的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1070445

相关文章

C#实现千万数据秒级导入的代码

《C#实现千万数据秒级导入的代码》在实际开发中excel导入很常见,现代社会中很容易遇到大数据处理业务,所以本文我就给大家分享一下千万数据秒级导入怎么实现,文中有详细的代码示例供大家参考,需要的朋友可... 目录前言一、数据存储二、处理逻辑优化前代码处理逻辑优化后的代码总结前言在实际开发中excel导入很

SpringBoot+RustFS 实现文件切片极速上传的实例代码

《SpringBoot+RustFS实现文件切片极速上传的实例代码》本文介绍利用SpringBoot和RustFS构建高性能文件切片上传系统,实现大文件秒传、断点续传和分片上传等功能,具有一定的参考... 目录一、为什么选择 RustFS + SpringBoot?二、环境准备与部署2.1 安装 RustF

Python实现Excel批量样式修改器(附完整代码)

《Python实现Excel批量样式修改器(附完整代码)》这篇文章主要为大家详细介绍了如何使用Python实现一个Excel批量样式修改器,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一... 目录前言功能特性核心功能界面特性系统要求安装说明使用指南基本操作流程高级功能技术实现核心技术栈关键函

Redis实现高效内存管理的示例代码

《Redis实现高效内存管理的示例代码》Redis内存管理是其核心功能之一,为了高效地利用内存,Redis采用了多种技术和策略,如优化的数据结构、内存分配策略、内存回收、数据压缩等,下面就来详细的介绍... 目录1. 内存分配策略jemalloc 的使用2. 数据压缩和编码ziplist示例代码3. 优化的

Python 基于http.server模块实现简单http服务的代码举例

《Python基于http.server模块实现简单http服务的代码举例》Pythonhttp.server模块通过继承BaseHTTPRequestHandler处理HTTP请求,使用Threa... 目录测试环境代码实现相关介绍模块简介类及相关函数简介参考链接测试环境win11专业版python

Python从Word文档中提取图片并生成PPT的操作代码

《Python从Word文档中提取图片并生成PPT的操作代码》在日常办公场景中,我们经常需要从Word文档中提取图片,并将这些图片整理到PowerPoint幻灯片中,手动完成这一任务既耗时又容易出错,... 目录引言背景与需求解决方案概述代码解析代码核心逻辑说明总结引言在日常办公场景中,我们经常需要从 W

使用Spring Cache本地缓存示例代码

《使用SpringCache本地缓存示例代码》缓存是提高应用程序性能的重要手段,通过将频繁访问的数据存储在内存中,可以减少数据库访问次数,从而加速数据读取,:本文主要介绍使用SpringCac... 目录一、Spring Cache简介核心特点:二、基础配置1. 添加依赖2. 启用缓存3. 缓存配置方案方案

MySQL的配置文件详解及实例代码

《MySQL的配置文件详解及实例代码》MySQL的配置文件是服务器运行的重要组成部分,用于设置服务器操作的各种参数,下面:本文主要介绍MySQL配置文件的相关资料,文中通过代码介绍的非常详细,需要... 目录前言一、配置文件结构1.[mysqld]2.[client]3.[mysql]4.[mysqldum

Python多线程实现大文件快速下载的代码实现

《Python多线程实现大文件快速下载的代码实现》在互联网时代,文件下载是日常操作之一,尤其是大文件,然而,网络条件不稳定或带宽有限时,下载速度会变得很慢,本文将介绍如何使用Python实现多线程下载... 目录引言一、多线程下载原理二、python实现多线程下载代码说明:三、实战案例四、注意事项五、总结引

Python脚本轻松实现检测麦克风功能

《Python脚本轻松实现检测麦克风功能》在进行音频处理或开发需要使用麦克风的应用程序时,确保麦克风功能正常是非常重要的,本文将介绍一个简单的Python脚本,能够帮助我们检测本地麦克风的功能,需要的... 目录轻松检测麦克风功能脚本介绍一、python环境准备二、代码解析三、使用方法四、知识扩展轻松检测麦