【用YOLOv5模型实现旅客行李5类异物检测——训练过程】

2023-12-22 04:10

本文主要是介绍【用YOLOv5模型实现旅客行李5类异物检测——训练过程】,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

-------Start

在开始以下操作之前需要安装Anaconda,并在Anaconda中配置pytorch深度学习环境. 完成以上配置之后再进行接下来的操作。

---------官方YOLOV5代码

---------地铁异物检测数据集

1. 下载代码,数据集,预训练权重

1.1 代码下载

在这里插入图片描述

文件解压

在这里插入图片描述

1.2 数据集下载

在这里插入图片描述

下载以下2个文件,并解压。在这里插入图片描述
xml为数据的标签文件,共8929个文件,至于xml文件中的内容大家可以百度学习下,这里不做讲解。

在这里插入图片描述

jpg文件为检测的X光图像,共8929张图像,一张图像对应一个xml文件。

在这里插入图片描述

1.3 预训练权重下载

在这里插入图片描述

2. 数据集整理

2.1 首先新建SIXray文件,里面包含如下内容:Annotations文件夹里为所有的xml文件,Images文件夹里为所有的jpg文件,ImageSets文件夹里再新建一个main文件夹,labels为空文件夹。

在这里插入图片描述

在这里插入图片描述

2.2 先修改以下代码的convert_annotation函数中in_file ,out_file 文件路径为你自己数据集所对应的路径。
import xml.etree.ElementTree as ET
import os
from os import getcwd
sets = ['train', 'val', 'test']
classes = ["Gun", "Knife","Wrench","Pliers", "Scissors"]
def convert(size, box):dw = 1. / (size[0])dh = 1. / (size[1])x = (box[0] + box[1]) / 2.0 - 1y = (box[2] + box[3]) / 2.0 - 1w = box[1] - box[0]h = box[3] - box[2]x = x * dww = w * dwy = y * dhh = h * dhreturn x, y, w, hdef convert_annotation(image_id):in_file = open('E:/chongda/SIXray/Annotations/%s.xml' % (image_id), encoding='UTF-8')out_file = open('E:/chongda/SIXray/labels/%s.txt' % (image_id), 'w')tree = ET.parse(in_file)root = tree.getroot()w = int(root.find('size').find('width').text)h = int(root.find('size').find('height').text)for obj in root.iter('object'):try:cls = obj.find('name').textexcept:continueif cls not in classes == 1:continuecls_id = classes.index(cls)xmlbox = obj.find('bndbox')b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),float(xmlbox.find('ymax').text))b1, b2, b3, b4 = b# 标注越界修正if b2 > w:b2 = wif b4 > h:b4 = hb = (b1, b2, b3, b4)bb = convert((w, h), b)out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')#划分训练集,测试集,验证集
def test():import osimport randomimport argparseparser = argparse.ArgumentParser()# xml文件的地址,根据自己的数据进行修改 xml一般存放在Annotations下parser.add_argument('--xml_path', default=r'E:\chongda\SIXray\labels', type=str, help='input xml label path')# 数据集的划分,地址选择自己数据下的ImageSets/Mainparser.add_argument('--txt_path', default=r'E:\chongda\SIXray\ImageSets\Main', type=str, help='output txt label path')opt = parser.parse_args()#训练集:验证集的比例trainval_percent = 0.9#训练集+验证集:测试集的比例train_percent = 0.9xmlfilepath = opt.xml_pathtxtsavepath = opt.txt_pathtotal_xml = os.listdir(xmlfilepath)if not os.path.exists(txtsavepath):os.makedirs(txtsavepath)random.seed(2022)num = len(total_xml)list_index = range(num)tv = int(num * trainval_percent)tr = int(tv * train_percent)trainval = random.sample(list_index, tv)train = random.sample(trainval, tr)file_trainval = open(txtsavepath + '/trainval.txt', 'w')file_test = open(txtsavepath + '/test.txt', 'w')file_train = open(txtsavepath + '/train.txt', 'w')file_val = open(txtsavepath + '/val.txt', 'w')for i in list_index:name = total_xml[i][:-4] + '\n'if i in trainval:file_trainval.write(name)if i in train:file_train.write(name)else:file_val.write(name)else:file_test.write(name)file_trainval.close()file_train.close()file_val.close()file_test.close()
#根据划分的数据集生成对应的文件路径
def test2():for image_set in sets:image_ids = open(r'E:\chongda\SIXray\ImageSets\Main\%s.txt' % (image_set)).read().strip().split()list_file = open(r'E:\chongda\SIXray\%s.txt' % (image_set), 'w')for image_id in image_ids:list_file.write('E:\chongda\SIXray\images\%s.jpg\n' % (image_id))list_file.close()
#将原数据标签转化成我们需要的标签
def test3():path = r'E:\chongda\SIXray\Annotations'for image_id in os.listdir(path):convert_annotation(image_id[:-4])
然后执行test3函数,执行完后会在labels文件夹里生成8929个txt文件,如下图所示。这一步操作是将xml标签文件转化成我们所需格式的文件。

在这里插入图片描述

2.3 修改以上代码的test函数中的两个路径值为你自己数据集相对应的位置。

在这里插入图片描述

修改完毕后,执行test函数,将产生以下文件,这一步操作是划分数据集为训练集,测试集,验证集。在这里插入图片描述
2.4 修改test2函数中的三处路径为你自己数据集所对应的路径。

在这里插入图片描述

修改完成后会在SIXray文件夹下生成如下文件。

在这里插入图片描述

检查其中文件的内容是否是图像的完整路径。

在这里插入图片描述

3. 代码整理

3.1 用pycharm导入解压后的代码文件

在这里插入图片描述

在data目录下新建my.yaml文件,文件内容如下所示,此处需要修改train,val,test的路径,值为你的数据集下txt文件的路径。

在这里插入图片描述

3.2 修改models下yolov5s.yaml文件中的nc值为5,代表要检测的5个类别。

在这里插入图片描述

3.3 将下载好的YOLOv5s模型预训练权重,并放在项目根目录下。

在这里插入图片描述

3.4 修改train.py文件中的相应参数,batchsize的值根据显卡的算力进行调整,通常取值为偶数。值越大,要求显卡的算力越高。

在这里插入图片描述

3.5 至此,修改完毕,执行train.py进行网络的训练。

在这里插入图片描述

3.6 控制台出现以下训练输出日志,表示训练完毕。程序会自动保存最后一次训练完毕的模型权重和最优模型权重。

在这里插入图片描述

运行完毕后,会在runs/train/的文件夹下保存每次训练的相关文件,weights存放的是模型的权重。best.pt是最优模型权重,last.pt是训练完毕的权重,其他文件可自行打开查看。

在这里插入图片描述

PR图像

在这里插入图片描述

训练过程指标变化

在这里插入图片描述

混淆矩阵

在这里插入图片描述

模型的测试过程请参考下一篇博文。

-------End

这篇关于【用YOLOv5模型实现旅客行李5类异物检测——训练过程】的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/522548

相关文章

Nginx 配置跨域的实现及常见问题解决

《Nginx配置跨域的实现及常见问题解决》本文主要介绍了Nginx配置跨域的实现及常见问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来... 目录1. 跨域1.1 同源策略1.2 跨域资源共享(CORS)2. Nginx 配置跨域的场景2.1

Python中提取文件名扩展名的多种方法实现

《Python中提取文件名扩展名的多种方法实现》在Python编程中,经常会遇到需要从文件名中提取扩展名的场景,Python提供了多种方法来实现这一功能,不同方法适用于不同的场景和需求,包括os.pa... 目录技术背景实现步骤方法一:使用os.path.splitext方法二:使用pathlib模块方法三

CSS实现元素撑满剩余空间的五种方法

《CSS实现元素撑满剩余空间的五种方法》在日常开发中,我们经常需要让某个元素占据容器的剩余空间,本文将介绍5种不同的方法来实现这个需求,并分析各种方法的优缺点,感兴趣的朋友一起看看吧... css实现元素撑满剩余空间的5种方法 在日常开发中,我们经常需要让某个元素占据容器的剩余空间。这是一个常见的布局需求

HTML5 getUserMedia API网页录音实现指南示例小结

《HTML5getUserMediaAPI网页录音实现指南示例小结》本教程将指导你如何利用这一API,结合WebAudioAPI,实现网页录音功能,从获取音频流到处理和保存录音,整个过程将逐步... 目录1. html5 getUserMedia API简介1.1 API概念与历史1.2 功能与优势1.3

Java实现删除文件中的指定内容

《Java实现删除文件中的指定内容》在日常开发中,经常需要对文本文件进行批量处理,其中,删除文件中指定内容是最常见的需求之一,下面我们就来看看如何使用java实现删除文件中的指定内容吧... 目录1. 项目背景详细介绍2. 项目需求详细介绍2.1 功能需求2.2 非功能需求3. 相关技术详细介绍3.1 Ja

使用Python和OpenCV库实现实时颜色识别系统

《使用Python和OpenCV库实现实时颜色识别系统》:本文主要介绍使用Python和OpenCV库实现的实时颜色识别系统,这个系统能够通过摄像头捕捉视频流,并在视频中指定区域内识别主要颜色(红... 目录一、引言二、系统概述三、代码解析1. 导入库2. 颜色识别函数3. 主程序循环四、HSV色彩空间详解

PostgreSQL中MVCC 机制的实现

《PostgreSQL中MVCC机制的实现》本文主要介绍了PostgreSQL中MVCC机制的实现,通过多版本数据存储、快照隔离和事务ID管理实现高并发读写,具有一定的参考价值,感兴趣的可以了解一下... 目录一 MVCC 基本原理python1.1 MVCC 核心概念1.2 与传统锁机制对比二 Postg

SpringBoot整合Flowable实现工作流的详细流程

《SpringBoot整合Flowable实现工作流的详细流程》Flowable是一个使用Java编写的轻量级业务流程引擎,Flowable流程引擎可用于部署BPMN2.0流程定义,创建这些流程定义的... 目录1、流程引擎介绍2、创建项目3、画流程图4、开发接口4.1 Java 类梳理4.2 查看流程图4

C++中零拷贝的多种实现方式

《C++中零拷贝的多种实现方式》本文主要介绍了C++中零拷贝的实现示例,旨在在减少数据在内存中的不必要复制,从而提高程序性能、降低内存使用并减少CPU消耗,零拷贝技术通过多种方式实现,下面就来了解一下... 目录一、C++中零拷贝技术的核心概念二、std::string_view 简介三、std::stri

C++高效内存池实现减少动态分配开销的解决方案

《C++高效内存池实现减少动态分配开销的解决方案》C++动态内存分配存在系统调用开销、碎片化和锁竞争等性能问题,内存池通过预分配、分块管理和缓存复用解决这些问题,下面就来了解一下... 目录一、C++内存分配的性能挑战二、内存池技术的核心原理三、主流内存池实现:TCMalloc与Jemalloc1. TCM