笔记1:基于锚框(先验框)的目标检测

2023-12-30 06:12

本文主要是介绍笔记1:基于锚框(先验框)的目标检测,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、边缘框(bounding box)

1.1 定义

边缘框:真实标注的物体位置

2.1 表示方式

1、(x1,y1)和(x2,y2)
2、(x1,y1)和w,h
在这里插入图片描述

二、锚框(anchor box)/先验框(prior bounding box)

2.1 定义

对边缘框的预测

2.2 预测方式

一般很难直接通过坐标数据预测边缘框,通常采用多个边缘框,当包含目标时,再慢慢调整。
第一步:判断是否包含感兴趣目标(目标类别)
第二步:预测锚框到真实边缘框的偏移(目标位置)
在这里插入图片描述
s是缩放比,r是宽高比

2.2.1 IOU 交并比

比较两个框之间的相似度
在这里插入图片描述
0表示没有重叠,1表示完全重合。

2.2.2 赋予锚框标号

在这里插入图片描述
每个锚框都是1个 训练样本(训练框)
锚框有2种属性,1是背景,即为负样本;2是关联边缘框,即为正样本
通常训练中我们会生成大量锚框,在这大量的锚框中,负样本居多
值得注意的是:
1、锚框生成要么是固定生成,要么是根据图片生成;而边缘框是提前标号的真实框,存好的标注
2、赋予锚框编号的过程是每次读入图片后都要进行1次的操作
3、赋予锚框编号的算法有很多种,这其实常见的其中一种。

三、非极大抑制输出(NMS)

目的:1个边缘框对应1个锚框
NMS作用:合并相似的预测
在这里插入图片描述
在这里插入图片描述

比如dog类的3个预测框中,最大的是0.9,那么第一步选择这个框,第二步计算dog=0.8、dog=0.7这2个框与dog=0.9的这个框的Iou值,如大于我们规定的值,去掉;cat是另外的类,不影响dog类的NMS;第3步,计算下一个类别的最大预测框,重复上述步骤。

四、总结

一类目标检测算法基于锚框来预测
首先生成大量锚框,并赋予标号,每个锚框作为一个样本进行训练
在预测时,使用NMS来去掉冗余的预测。

这篇关于笔记1:基于锚框(先验框)的目标检测的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/551944

相关文章

OpenCV实现实时颜色检测的示例

《OpenCV实现实时颜色检测的示例》本文主要介绍了OpenCV实现实时颜色检测的示例,通过HSV色彩空间转换和色调范围判断实现红黄绿蓝颜色检测,包含视频捕捉、区域标记、颜色分析等功能,具有一定的参考... 目录一、引言二、系统概述三、代码解析1. 导入库2. 颜色识别函数3. 主程序循环四、HSV色彩空间

使用Python实现IP地址和端口状态检测与监控

《使用Python实现IP地址和端口状态检测与监控》在网络运维和服务器管理中,IP地址和端口的可用性监控是保障业务连续性的基础需求,本文将带你用Python从零打造一个高可用IP监控系统,感兴趣的小伙... 目录概述:为什么需要IP监控系统使用步骤说明1. 环境准备2. 系统部署3. 核心功能配置系统效果展

利用Python快速搭建Markdown笔记发布系统

《利用Python快速搭建Markdown笔记发布系统》这篇文章主要为大家详细介绍了使用Python生态的成熟工具,在30分钟内搭建一个支持Markdown渲染、分类标签、全文搜索的私有化知识发布系统... 目录引言:为什么要自建知识博客一、技术选型:极简主义开发栈二、系统架构设计三、核心代码实现(分步解析

python+opencv处理颜色之将目标颜色转换实例代码

《python+opencv处理颜色之将目标颜色转换实例代码》OpenCV是一个的跨平台计算机视觉库,可以运行在Linux、Windows和MacOS操作系统上,:本文主要介绍python+ope... 目录下面是代码+ 效果 + 解释转HSV: 关于颜色总是要转HSV的掩膜再标注总结 目标:将红色的部分滤

Python如何实现PDF隐私信息检测

《Python如何实现PDF隐私信息检测》随着越来越多的个人信息以电子形式存储和传输,确保这些信息的安全至关重要,本文将介绍如何使用Python检测PDF文件中的隐私信息,需要的可以参考下... 目录项目背景技术栈代码解析功能说明运行结php果在当今,数据隐私保护变得尤为重要。随着越来越多的个人信息以电子形

SpringBoot使用Apache Tika检测敏感信息

《SpringBoot使用ApacheTika检测敏感信息》ApacheTika是一个功能强大的内容分析工具,它能够从多种文件格式中提取文本、元数据以及其他结构化信息,下面我们来看看如何使用Ap... 目录Tika 主要特性1. 多格式支持2. 自动文件类型检测3. 文本和元数据提取4. 支持 OCR(光学

如何用Java结合经纬度位置计算目标点的日出日落时间详解

《如何用Java结合经纬度位置计算目标点的日出日落时间详解》这篇文章主详细讲解了如何基于目标点的经纬度计算日出日落时间,提供了在线API和Java库两种计算方法,并通过实际案例展示了其应用,需要的朋友... 目录前言一、应用示例1、天安门升旗时间2、湖南省日出日落信息二、Java日出日落计算1、在线API2

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

烟火目标检测数据集 7800张 烟火检测 带标注 voc yolo

一个包含7800张带标注图像的数据集,专门用于烟火目标检测,是一个非常有价值的资源,尤其对于那些致力于公共安全、事件管理和烟花表演监控等领域的人士而言。下面是对此数据集的一个详细介绍: 数据集名称:烟火目标检测数据集 数据集规模: 图片数量:7800张类别:主要包含烟火类目标,可能还包括其他相关类别,如烟火发射装置、背景等。格式:图像文件通常为JPEG或PNG格式;标注文件可能为X

【学习笔记】 陈强-机器学习-Python-Ch15 人工神经网络(1)sklearn

系列文章目录 监督学习:参数方法 【学习笔记】 陈强-机器学习-Python-Ch4 线性回归 【学习笔记】 陈强-机器学习-Python-Ch5 逻辑回归 【课后题练习】 陈强-机器学习-Python-Ch5 逻辑回归(SAheart.csv) 【学习笔记】 陈强-机器学习-Python-Ch6 多项逻辑回归 【学习笔记 及 课后题练习】 陈强-机器学习-Python-Ch7 判别分析 【学