手把手教你如何使用MMDetection训练自己的数据集

2024-09-04 14:28

本文主要是介绍手把手教你如何使用MMDetection训练自己的数据集,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 一、配置环境
    • 1. 创建一个名为mmdetection的虚拟环境
    • 2. 安装GPU版本的PyTorch
    • 3. 安装mmdetection所需的包
  • 二、下载源码并安装配置文件
    • 1. 下载 GitHub 上的mmdetection源码到本地
    • 2. 安装源码中的配置文件
    • 3. 配置成功
  • 三、测试是否成功安装
    • 1. 下载配置文件和模型权重文件。
    • 2. 推理验证
  • 四、数据集准备
    • 1. 准备好coco格式的数据集
    • 2. 创建新的数据集类
    • 3. 录入数据集
  • 五、模型准备
    • 1. 模型选择
    • 2. 配置文件准备及修改
      • 生成配置文件
      • 修改配置文件
      • 注册数据集的metainfo
    • 3. 模型训练

参考 : MMDetection全流程实战指南:手把手带你构建目标检测模型

一、配置环境

1. 创建一个名为mmdetection的虚拟环境

conda create -n mmdetection python=3.9 -y
conda activate mmdetection

2. 安装GPU版本的PyTorch

# GPU版本
conda install pytorch torchvision -c pytorch

这里如果安装失败了需要去官网 pytorch官网 找对应的版本下载;

先输入nvidia-smi命令查看可下载的cuda的最高版本
在这里插入图片描述
我的可下载的最高CUDA版本为12.0,因此我选择11.8的这个下载命令进行下载

在这里插入图片描述
在这里插入图片描述

下载后进行检验是否安装成功

import torch
torch.cuda.is_available()
exit()

在这里插入图片描述
可以看到输出为true,安装成功。

3. 安装mmdetection所需的包

使用 OpenMMLab 推出的 MIM 来安装 MMEngine 和 MMCV 两个必要的库。

pip install -U openmim
mim install mmengine
mim install "mmcv>=2.0.0"

至此,需要下载的包就都全部完成了,可以使用conda list命令来查看一下是否都安装成功了。
在这里插入图片描述

二、下载源码并安装配置文件

1. 下载 GitHub 上的mmdetection源码到本地

cd /path #(进入到你自己下载mmdetection代码的位置)
# 在Github上git代码
git clone https://github.com/open-mmlab/mmdetection.git

如果git失败就直接下载源码即可

github-mmdetection

在这里插入图片描述

2. 安装源码中的配置文件

# 进入mmdetection对应的文件夹
cd mmdetection
# 安装配置文件
pip install -v -e .

在这里插入图片描述

3. 配置成功

在这里插入图片描述

三、测试是否成功安装

1. 下载配置文件和模型权重文件。

mim download mmdet --config rtmdet_tiny_8xb32-300e_coco --dest .

在这里插入图片描述
下载结束后可以在当前文件夹中发现两个文件

  • rtmdet_tiny_8xb32-300e_coco.py
  • rtmdet_tiny_8xb32-300e_coco_20220902_112414-78e30dcc.pth。
    在这里插入图片描述

2. 推理验证

python demo/image_demo.py demo/demo.jpg rtmdet_tiny_8xb32-300e_coco.py --weights rtmdet_tiny_8xb32-300e_coco_20220902_112414-78e30dcc.pth --device cuda

在输入命令后我遇到了 “AssertionError: MMCV==2.2.0 is used but incompatible. Please install mmcv>=2.0.0rc4, <2.2.0” 的问题

在这里插入图片描述

  • 解决方法:注释掉/mmdetection-main/mmdet/init.py文件中的相关断言
# assert (mmcv_version >= digit_version(mmcv_minimum_version)
#         and mmcv_version < digit_version(mmcv_maximum_version)), \
#     f'MMCV=={mmcv.__version__} is used but incompatible. ' \
#     f'Please install mmcv>={mmcv_minimum_version}, <{mmcv_maximum_version}.'

在这里插入图片描述
再次运行后成功

在这里插入图片描述
结果可在outputs文件夹中查看;

在这里插入图片描述
至此mmdetection的安装和配置完成,下面将进行自定义数据集的配置。

四、数据集准备

1. 准备好coco格式的数据集

coco格式数据集如下所示:

在这里插入图片描述
在mmdetection文件夹下新建一个data数据集,再新建一个子文件夹名为coco,然后存放自己的数据集;

在这里插入图片描述

2. 创建新的数据集类

进入 mmdet/datasets 这个文件夹里,并创建一个自己命名数据集的 Python 文件,我的叫做plantdoc.py

在这里插入图片描述
由于是 coco 格式的数据集,因此可以直接复制名为 coco.py 文件的内容到 plantdoc.py 文件,然后修改里面对应的内容。

我们需要把coco.py中的类名数据集中的类别标注的颜色换成自己的数据集的类名

  • 下图为coco.py中的内容
    在这里插入图片描述

  • 下图为我自己的plantdoc.py类
    在这里插入图片描述

3. 录入数据集

在mmdet/datasets/init.py中仿照coco的格式把我们自己的数据集进行录入。

  • import 的内容就是我们自定义的 dataset 名字
  • 最后在下面也要加上对应 Dataset 的名称。
    在这里插入图片描述

五、模型准备

1. 模型选择

在config文件夹中选择想要使用的目标检测模型,我这里选择的是deformable_detr

在这里插入图片描述

配置文件中设置的epoch=50,batch=32,我这里根据我自己的设备修改为了epoch=36,batch=8

在这里插入图片描述

2. 配置文件准备及修改

由于在 MMDetection 里大多用的都是 COCO 格式的数据集,因此在这里直接修改 work_dir 文件夹里对应的配置文件会比起重新创建更加的方便。

生成配置文件

首先运行deformable-detr的训练命令

python tools/train.py configs/deformable_detr/deformable-detr_r50_16xb2-50e_coco.py

可以看到mmdetection文件夹中生成了一个work_dirs子文件夹,deformable-detr_r50_16xb2-50e_coco.py中就是完整的配置文件;

在这里插入图片描述

修改配置文件

把配置文件修改成和我们自己的数据集适配

  • 修改数据集类别数:从80改为27(自己的数据集类别个数)

在这里插入图片描述

  • 修改dataset_type:从CocoDataset改为PlantdocDataset(自己的数据集名称)

在这里插入图片描述

  • 还可以修改学习率:比如数据集很少的话,可以把学习率调得比较小,从而让其能够慢慢的学习到图像的特征。

注册数据集的metainfo

在配置文件中创建一个 metainfo,将自己的 classes(标签类别)和 palette(调色板)写入,并且在 train_dataloader、val_dataloader 和 test_dataloader 里写入;

  • 我的数据集的metainfo:

在这里插入图片描述

metainfo = dict(classes=('Tomato Septoria leaf spot','Bell_pepper leaf','Corn rust leaf','Potato leaf late blight','Corn leaf blight','Strawberry leaf','Tomato leaf late blight','Blueberry leaf','Soyabean leaf','Tomato mold leaf','Squash Powdery mildew leaf','Raspberry leaf','Tomato leaf bacterial spot','Apple rust leaf','Peach leaf','Potato leaf early blight','Tomato Early blight leaf','Apple Scab Leaf','Grape leaf','Tomato leaf','Grape leaf black rot','Apple leaf','Corn Gray leaf spot','Bell_pepper leaf spot','Cherry leaf','Tomato leaf mosaic virus','Tomato leaf yellow virus',),palette=[(220,20,60,),(119,11,32,),(0,0,142,),(0,0,230,),(106,0,228,),(0,60,100,),(0,80,100,),(0,0,70,),(0,0,192,),(250,170,30,),(100,170,30,),(220,220,0,),(175,116,175,),(250,0,30,),(165,42,42,),(255,77,255,),(0,226,252,),(182,182,255,),(0,82,0,),(120,166,157,),(110,76,0,),(174,57,255,),(199,100,0,),(72,0,118,),(255,179,240,),(0,125,92,),(209,0,151,),])

在train_dataloader、test_dataloader、val_dataloader中都写入;

在这里插入图片描述
在这里插入图片描述

3. 模型训练

此时我们运行work_dirs目录下的配置文件,然后就可以开始训练啦

python tools/train.py work_dirs/deformable-detr_r50_16xb2-50e_coco.py

在这里插入图片描述
可以查看每个epoch的loss、剩余时间等等

这篇关于手把手教你如何使用MMDetection训练自己的数据集的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1136229

相关文章

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

Android Paging 分页加载库使用实践

《AndroidPaging分页加载库使用实践》AndroidPaging库是Jetpack组件的一部分,它提供了一套完整的解决方案来处理大型数据集的分页加载,本文将深入探讨Paging库... 目录前言一、Paging 库概述二、Paging 3 核心组件1. PagingSource2. Pager3.

python使用try函数详解

《python使用try函数详解》Pythontry语句用于异常处理,支持捕获特定/多种异常、else/final子句确保资源释放,结合with语句自动清理,可自定义异常及嵌套结构,灵活应对错误场景... 目录try 函数的基本语法捕获特定异常捕获多个异常使用 else 子句使用 finally 子句捕获所

C++11右值引用与Lambda表达式的使用

《C++11右值引用与Lambda表达式的使用》C++11引入右值引用,实现移动语义提升性能,支持资源转移与完美转发;同时引入Lambda表达式,简化匿名函数定义,通过捕获列表和参数列表灵活处理变量... 目录C++11新特性右值引用和移动语义左值 / 右值常见的左值和右值移动语义移动构造函数移动复制运算符

Python对接支付宝支付之使用AliPay实现的详细操作指南

《Python对接支付宝支付之使用AliPay实现的详细操作指南》支付宝没有提供PythonSDK,但是强大的github就有提供python-alipay-sdk,封装里很多复杂操作,使用这个我们就... 目录一、引言二、准备工作2.1 支付宝开放平台入驻与应用创建2.2 密钥生成与配置2.3 安装ali

C#中lock关键字的使用小结

《C#中lock关键字的使用小结》在C#中,lock关键字用于确保当一个线程位于给定实例的代码块中时,其他线程无法访问同一实例的该代码块,下面就来介绍一下lock关键字的使用... 目录使用方式工作原理注意事项示例代码为什么不能lock值类型在C#中,lock关键字用于确保当一个线程位于给定实例的代码块中时

MySQL 强制使用特定索引的操作

《MySQL强制使用特定索引的操作》MySQL可通过FORCEINDEX、USEINDEX等语法强制查询使用特定索引,但优化器可能不采纳,需结合EXPLAIN分析执行计划,避免性能下降,注意版本差异... 目录1. 使用FORCE INDEX语法2. 使用USE INDEX语法3. 使用IGNORE IND

C# $字符串插值的使用

《C#$字符串插值的使用》本文介绍了C#中的字符串插值功能,详细介绍了使用$符号的实现方式,文中通过示例代码介绍的非常详细,需要的朋友们下面随着小编来一起学习学习吧... 目录$ 字符使用方式创建内插字符串包含不同的数据类型控制内插表达式的格式控制内插表达式的对齐方式内插表达式中使用转义序列内插表达式中使用

flask库中sessions.py的使用小结

《flask库中sessions.py的使用小结》在Flask中Session是一种用于在不同请求之间存储用户数据的机制,Session默认是基于客户端Cookie的,但数据会经过加密签名,防止篡改,... 目录1. Flask Session 的基本使用(1) 启用 Session(2) 存储和读取 Se

Java Thread中join方法使用举例详解

《JavaThread中join方法使用举例详解》JavaThread中join()方法主要是让调用改方法的thread完成run方法里面的东西后,在执行join()方法后面的代码,这篇文章主要介绍... 目录前言1.join()方法的定义和作用2.join()方法的三个重载版本3.join()方法的工作原