【YOLOv5改进系列(8)】高效涨点----添加yolov7中Aux head 辅助训练头

2024-03-30 01:28

本文主要是介绍【YOLOv5改进系列(8)】高效涨点----添加yolov7中Aux head 辅助训练头,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述


文章目录

  • 🚀🚀🚀前言
  • 一、1️⃣ Auxiliary head辅助头简单介绍
  • 二、2️⃣从损失函数和标签分配分析
  • 三、3️⃣正负样本标签分配
  • 四、4️⃣如何添加Aux head辅助训练头
  • 五、5️⃣实验部分(后续添加,还是跑模型,辅助头真是太慢了!!!)


在这里插入图片描述

👀🎉📜系列文章目录

【YOLOv5改进系列(1)】高效涨点----使用EIoU、Alpha-IoU、SIoU、Focal-EIOU替换CIou
【YOLOv5改进系列(2)】高效涨点----Wise-IoU详细解读及使用Wise-IoU(WIOU)替换CIOU
【YOLOv5改进系列(3)】高效涨点----Optimal Transport Assignment:OTA最优传输方法
【YOLOv5改进系列(4)】高效涨点----添加可变形卷积DCNv2
【YOLOv5改进系列(5)】高效涨点----添加密集小目标检测NWD方法
【YOLOv5改进系列(6)】高效涨点----使用DAMO-YOLO中的Efficient RepGFPN模块替换yolov5中的Neck部分
【YOLOv5改进系列(7)】高效涨点----使用yolov8中的C2F模块替换yolov5中的C3模块

🚀🚀🚀前言

auxiliary head辅助训练头是出至yolov7论文,这两天都在研究如何能够将v8和v7的一些模块添加到yolov5中,添加 Aux head 的主要原因是让网络中间层学到更多信息,有更丰富的梯度信息帮助训练。这里要注意,好的梯度信息能够让相同参数量的网络学的更好。这里的yolov5除了添加了辅助训练头,而且还进行了改进,将之前的OTA最优传输也添加进来,用于优化标签分配策略,添加之后我感觉训练损失慢了5倍不止,但是收敛效果和识别精度要提高了不少。

📜yolov7论文:YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors
📌论文代码:https://github.com/WongKinYiu/yolov7


一、1️⃣ Auxiliary head辅助头简单介绍

左边是正常训练,在经过上采样和下采样以及特征融合之后,将输出特征进行分类和识别,而Auxiliary head则是在特征输出之前在中间添加一部分辅助头。
在这里插入图片描述


二、2️⃣从损失函数和标签分配分析

深度监督
意思是在模型训练的过程中,除了最终的检测头,在中间的层也增加了辅助检测头,这个辅助检测头也会加入到损失函数的计算中,并且辅助反向传播,去更新前面的参数。

标签分类
标签分配指的是把输入图片中的标注框和最终预测的预测值对应起来,便于进一步求损失值。

标检测的损失往往由三个部分组成:分类损失Lcls,置信度损失Lobj与边界框的iou损失Lbox。Lcls与Lbox仅由正样本产生,而Lobj则由所有样本产生。

不同于DETR这种端到端的目标检测算法,YOLO会产生大量的预测框,每一个预测框称之为一个样本。那么对于产生的这些预测框,哪些应该作为正样本去与gt(ground truth)计算Lbox与Lcls,哪些又应该作为负样本仅仅贡献Lobj呢?这就取决于所定义的标签分配方法。

在过去的深度网络训练中,标签分配通常直接引用GT(真实标签),并根据给定的规则生成硬标签。比如YOLOv5中,根据中心点所在的位置加入附近两个格子,即同时分配给三个位置来预测。这种方法就叫做硬标签,因为他是直接根据gt来直接产生每个格子的标签,传入损失函数中求损失值

而YOLOv7中使用的是软标签分配方法。在该方法中,Head产生的预测值和GT一起传给分配器,才会得到每个网格的目标值,利用这里的软标签再和预测值一起传入损失函数中求损失值

常规思路是:由于用到了辅助头训练,因此分开求Lead Head和辅助头的软标签和损失值。比如图©中的辅助头训练。
在这里插入图片描述
但是YOLOv7提出了2种新方法。

  • 第一种是辅助头求Loss时,直接利用Lead Head产生的软标签进行计算。(图d)
  • 第二种是在第一种的基础上产生了course标签fine标签两种标签(也就是细粒度和粗糙标签)。(图c 比较难)

其中fine label 会用于训练 Lead head ,而Aux head 因为抽象能力弱则使用 coarse 的标签进行训练。


三、3️⃣正负样本标签分配

OTA最优传输标签分配中认为先根据正样本可能出现的区域进行筛选然后再计算 IoU Loss 或者其他进行进一步的标签分配。YOLO v7 中继承了这一做法,也就有了 coarse 的操作。
在这里插入图片描述
🔥在上图中,展示了如何制作从粗到精的约束导联头引导标签分配器。通过限制两个额外候选正网格(图中黄色网格)的解码器来进行动态约束。理论上,黄色网格需要预测[1,2]的范围来拟合真实值边界盒,我们使解码器只能预测[-0.5,1.5]的范围。这个约束使得模型可以自动学习不同层次的粉色网格和黄色网格。


四、4️⃣如何添加Aux head辅助训练头

🚀首先看一下配置文件的区别,左边是添加了3层辅助训练头的yaml文件,右边是正常的yolov5网络结构。在原有的[17, 20, 23]上面又添加了[24, 25, 26]进行训练。

在这里插入图片描述
🔥🔥🔥🔥🔥🔥除了yaml中的head部分需要修改,另外需要修改的就是损失函数,yolov7中的是ComputeLossAuxOTA损失,因为需要添加很多代码,而且部分代码的修改比较复杂,防止在训练过程中报错,这里建议直接将下面的代码文件,与yolov5-v7.0中的对应代码进行替换。
在这里插入图片描述

五、5️⃣实验部分(后续添加,还是跑模型,辅助头真是太慢了!!!)


在这里插入图片描述

这篇关于【YOLOv5改进系列(8)】高效涨点----添加yolov7中Aux head 辅助训练头的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/860163

相关文章

macOS Sequoia 15.5 发布: 改进邮件和屏幕使用时间功能

《macOSSequoia15.5发布:改进邮件和屏幕使用时间功能》经过常规Beta测试后,新的macOSSequoia15.5现已公开发布,但重要的新功能将被保留到WWDC和... MACOS Sequoia 15.5 正式发布!本次更新为 Mac 用户带来了一系列功能强化、错误修复和安全性提升,进一步增

使用Python和SQLAlchemy实现高效的邮件发送系统

《使用Python和SQLAlchemy实现高效的邮件发送系统》在现代Web应用中,邮件通知是不可或缺的功能之一,无论是订单确认、文件处理结果通知,还是系统告警,邮件都是最常用的通信方式之一,本文将详... 目录引言1. 需求分析2. 数据库设计2.1 User 表(存储用户信息)2.2 CustomerO

Java中的StringBuilder之如何高效构建字符串

《Java中的StringBuilder之如何高效构建字符串》本文将深入浅出地介绍StringBuilder的使用方法、性能优势以及相关字符串处理技术,结合代码示例帮助读者更好地理解和应用,希望对大家... 目录关键点什么是 StringBuilder?为什么需要 StringBuilder?如何使用 St

MySQL重复数据处理的七种高效方法

《MySQL重复数据处理的七种高效方法》你是不是也曾遇到过这样的烦恼:明明系统测试时一切正常,上线后却频频出现重复数据,大批量导数据时,总有那么几条不听话的记录导致整个事务莫名回滚,今天,我就跟大家分... 目录1. 重复数据插入问题分析1.1 问题本质1.2 常见场景图2. 基础解决方案:使用异常捕获3.

如何高效移除C++关联容器中的元素

《如何高效移除C++关联容器中的元素》关联容器和顺序容器有着很大不同,关联容器中的元素是按照关键字来保存和访问的,而顺序容器中的元素是按它们在容器中的位置来顺序保存和访问的,本文介绍了如何高效移除C+... 目录一、简介二、移除给定位置的元素三、移除与特定键值等价的元素四、移除满足特android定条件的元

基于Python实现高效PPT转图片工具

《基于Python实现高效PPT转图片工具》在日常工作中,PPT是我们常用的演示工具,但有时候我们需要将PPT的内容提取为图片格式以便于展示或保存,所以本文将用Python实现PPT转PNG工具,希望... 目录1. 概述2. 功能使用2.1 安装依赖2.2 使用步骤2.3 代码实现2.4 GUI界面3.效

Java图片压缩三种高效压缩方案详细解析

《Java图片压缩三种高效压缩方案详细解析》图片压缩通常涉及减少图片的尺寸缩放、调整图片的质量(针对JPEG、PNG等)、使用特定的算法来减少图片的数据量等,:本文主要介绍Java图片压缩三种高效... 目录一、基于OpenCV的智能尺寸压缩技术亮点:适用场景:二、JPEG质量参数压缩关键技术:压缩效果对比

C#使用SQLite进行大数据量高效处理的代码示例

《C#使用SQLite进行大数据量高效处理的代码示例》在软件开发中,高效处理大数据量是一个常见且具有挑战性的任务,SQLite因其零配置、嵌入式、跨平台的特性,成为许多开发者的首选数据库,本文将深入探... 目录前言准备工作数据实体核心技术批量插入:从乌龟到猎豹的蜕变分页查询:加载百万数据异步处理:拒绝界面

Spring Boot + MyBatis Plus 高效开发实战从入门到进阶优化(推荐)

《SpringBoot+MyBatisPlus高效开发实战从入门到进阶优化(推荐)》本文将详细介绍SpringBoot+MyBatisPlus的完整开发流程,并深入剖析分页查询、批量操作、动... 目录Spring Boot + MyBATis Plus 高效开发实战:从入门到进阶优化1. MyBatis

SpringBoot使用OkHttp完成高效网络请求详解

《SpringBoot使用OkHttp完成高效网络请求详解》OkHttp是一个高效的HTTP客户端,支持同步和异步请求,且具备自动处理cookie、缓存和连接池等高级功能,下面我们来看看SpringB... 目录一、OkHttp 简介二、在 Spring Boot 中集成 OkHttp三、封装 OkHttp