P1-YOLO学习1.1-YOLOV1

2024-02-13 17:59
文章标签 学习 yolo 1.1 p1 yolov1

本文主要是介绍P1-YOLO学习1.1-YOLOV1,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

一.YOLOV1

        1.Abstract

        2.Core

        3.NetWork

        4.Training 

        5.Experiments

         6.WebNet

        7.Innovation point


一.YOLOV1

        1.Abstract

                

        分析:You Only Look Once 即你只看一遍即可。本文提出了一种不同与分类器检测的思想,即一种一个CNN解决一个回归问题。其优点为检测速度(FPS)和mAP很快,因此非常适合视频实时检测。

        2.Core

 

         YOLOV1的核心思想是将图像分成S*S的小网格,如果物体的中心点落在了某一个网格内,那么就由这个网格来进行预测这个物体。

        每个中心点产生两个候选框(YOLOV1中bicth=2)B1(x1,y1,w1,h1) B2(x2,y2,w2,h2),实现代码中对其进行归一化(分别除以图像的w和h),然后拿真实值算iou,谁的iou大进行微调,每个候选框有一个置信度confidence(当前这个点是物体还不是物体)或者大于某个阈值。每个格子预测一下格子内是什么物体。

        Q1:多点产生重合的框怎么办?

                NMS(非极大值抑制):按置信度进行排序,选最大的

        Class probability map(类概率图):每个cell只负责预测一个类别

总结:YOLOV1核心思想是将目标检测问题转换为一个回归问题,通过一个单独的神经网络模型预测目标的位置和类别。

        1>单次预测:YOLOV1采用一次向前传播,直接再整个图像上生成目标的预测,避免多次预测和区域划分的过程

        2>网格划分:YOLOV1将图像分割成一个固定大小的网格,每个网格负责预测目标信息

        3>边界框预测:每个边界框由一组坐标值表示,包括x,y,h,w,使用回归模型预测边界框的坐标,网络输出是相对网格单元的偏移量和边界框的宽高比

        4>类别预测:对于每个网格,YOLOV1预测多个类别的概率。

        5>损失函数:使用自定义的损失函数平衡边界框位置预测和类别预测的损失

        3.NetWork

        

         神经网络受GoogleNet启发采用24个卷积层和两个全连接层,但不同的是初始模块采用了1*1和3*3的卷积核

        Q2:为什么是448*448*3?

                受到了全链接层的限制,必须固定图片大小。

        第一个全连接层转换为4096个特征

        第二个全连接层为1470,其含义为7*7的格子,每个格子预测出30个值

        

         Q3:为什么用来两个全连接层?

                两个全连接层能够解决非线性问题

        其中30的含义,前5为b1,再5为b2,剩余20为分类任务

        4.Training 

        

 

        Q4:为什么位置误差中w,h加上了根号?

                 为了统一大小物体的误差

        数值较小更敏感,但解决的不大,后面版本还有改进

        5.Experiments

         6.WebNet

YOLO: Real-Time Object Detection

        7.Innovation point

        1>首次提出one-stage的概念实现end-to-end的图像检测,因其FPS远远高于同时期其他模型,因此YOLO更适用于实时检测

        2>为了提高检测速度,每个检测点只选出两个候选框进行识别预测

        3>提出了比较合理的损失函数

这篇关于P1-YOLO学习1.1-YOLOV1的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/706218

相关文章

Unity新手入门学习殿堂级知识详细讲解(图文)

《Unity新手入门学习殿堂级知识详细讲解(图文)》Unity是一款跨平台游戏引擎,支持2D/3D及VR/AR开发,核心功能模块包括图形、音频、物理等,通过可视化编辑器与脚本扩展实现开发,项目结构含A... 目录入门概述什么是 UnityUnity引擎基础认知编辑器核心操作Unity 编辑器项目模式分类工程

Python学习笔记之getattr和hasattr用法示例详解

《Python学习笔记之getattr和hasattr用法示例详解》在Python中,hasattr()、getattr()和setattr()是一组内置函数,用于对对象的属性进行操作和查询,这篇文章... 目录1.getattr用法详解1.1 基本作用1.2 示例1.3 原理2.hasattr用法详解2.

Nginx禁用TLSv1.0 1.1改为TLSv1.2 1.3的操作方法

《Nginx禁用TLSv1.01.1改为TLSv1.21.3的操作方法》使用MozillaSSL配置工具生成配置,修改nginx.conf的ssl_protocols和ssl_ciphers,通... 目录方法一:方法二:使用 MoziChina编程lla 提供的 在线生成SSL配置工具,根据自己的环境填充对应的

Go学习记录之runtime包深入解析

《Go学习记录之runtime包深入解析》Go语言runtime包管理运行时环境,涵盖goroutine调度、内存分配、垃圾回收、类型信息等核心功能,:本文主要介绍Go学习记录之runtime包的... 目录前言:一、runtime包内容学习1、作用:① Goroutine和并发控制:② 垃圾回收:③ 栈和

Android学习总结之Java和kotlin区别超详细分析

《Android学习总结之Java和kotlin区别超详细分析》Java和Kotlin都是用于Android开发的编程语言,它们各自具有独特的特点和优势,:本文主要介绍Android学习总结之Ja... 目录一、空安全机制真题 1:Kotlin 如何解决 Java 的 NullPointerExceptio

重新对Java的类加载器的学习方式

《重新对Java的类加载器的学习方式》:本文主要介绍重新对Java的类加载器的学习方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、介绍1.1、简介1.2、符号引用和直接引用1、符号引用2、直接引用3、符号转直接的过程2、加载流程3、类加载的分类3.1、显示

Java学习手册之Filter和Listener使用方法

《Java学习手册之Filter和Listener使用方法》:本文主要介绍Java学习手册之Filter和Listener使用方法的相关资料,Filter是一种拦截器,可以在请求到达Servl... 目录一、Filter(过滤器)1. Filter 的工作原理2. Filter 的配置与使用二、Listen

Java进阶学习之如何开启远程调式

《Java进阶学习之如何开启远程调式》Java开发中的远程调试是一项至关重要的技能,特别是在处理生产环境的问题或者协作开发时,:本文主要介绍Java进阶学习之如何开启远程调式的相关资料,需要的朋友... 目录概述Java远程调试的开启与底层原理开启Java远程调试底层原理JVM参数总结&nbsMbKKXJx

Java深度学习库DJL实现Python的NumPy方式

《Java深度学习库DJL实现Python的NumPy方式》本文介绍了DJL库的背景和基本功能,包括NDArray的创建、数学运算、数据获取和设置等,同时,还展示了如何使用NDArray进行数据预处理... 目录1 NDArray 的背景介绍1.1 架构2 JavaDJL使用2.1 安装DJL2.2 基本操

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert