基于Paddle的计算机视觉入门教程——第5讲 实战:PaddleX实现垃圾分类

本文主要是介绍基于Paddle的计算机视觉入门教程——第5讲 实战:PaddleX实现垃圾分类,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

PaddleX实现垃圾分类

B站教程地址

https://www.bilibili.com/video/BV18b4y1J7a6/

PaddleX的安装

pip install paddlex==2.1.0 -i https://mirror.baidu.com/pypi/simple

因为PaddleX依赖于pycocotools,如果报错:

Microsoft Visual C++ 14.0 is required

则需要安装相应工具,下载链接如下:

链接:https://pan.baidu.com/s/17pSEX9ZO28_OIPdaeNAe3A
提取码:xhu4

如果出现下载预训练模型报错

SSLError("Can't connect to HTTPS URL because the SSL module is not available)

需要安装OpenSLL工具,下载链接如下:

链接:https://pan.baidu.com/s/1Z3F9cIH3-6QrsqnAoK-pBw
提取码:ucko

数据集的准备

数据集下载链接:

链接:https://pan.baidu.com/s/1ZSHQft4eIpYHliKRxZcChQ
提取码:hce7

本次实战为图片分类任务数据集结构如下:

在这里插入图片描述

分别为分类的图片文件夹,建议有一个类别就建一个文件夹,方便管理。训练集和评价集的标签文件,格式如下:

./3/933.jpg 3
./2/1670.jpg 2
./2/2175.jpg 2
./1/934.jpg 1
./1/1653.jpg 1

前面为图片的相对路径,后面为对应的标签类别。labels.txt存放对应的标签,格式如下:

有害垃圾
可回收垃圾
厨房垃圾
其他垃圾

提供文件重命名的代码,用于每个文件夹里面图片的重命名

import osdef rename():res = os.listdir('./')for a in res:i = 0flag = os.path.isdir(a)if(flag == False):continuepath=afilelist=os.listdir(path)#该文件夹下所有的文件(包括文件夹)for files in filelist:#遍历所有文件i=i+1Olddir=os.path.join(path,files);#原来的文件路径                if os.path.isdir(Olddir):#如果是文件夹则跳过continuefilename=os.path.splitext(files)[0];#文件名filetype=os.path.splitext(files)[1];#文件扩展名Newdir=os.path.join(path,str(i)+filetype);#新的文件路径os.rename(Olddir,Newdir)#重命名
rename()

提供生成train.txt和eval.txt文件的代码,分类的比例为5:1

import os
import randomdef ReadFileDatas():FileNamelist = []file = open('train.txt','r+')for line in file:line=line.strip('\n') #删除每一行的\nFileNamelist.append(line)#print('len ( FileNamelist ) = ' ,len(FileNamelist))file.close()return FileNamelistdef WriteDatasToFile(listInfo):file_handle_train=open('train.txt',mode='w')file_handle_eval = open("eval.txt",mode='w')i = 0for idx in range(len(listInfo)):str = listInfo[idx]#查找最后一个 “_”的位置ndex = str.rfind('_')#print('ndex = ',ndex)#截取字符串str_houZhui = str[(ndex+1):]#print('str_houZhui = ',str_houZhui)str_Result = str  + '\n'           #+ str_houZhui+'\n'#print(str_Result)if(i%6 != 0):file_handle_train.write(str_Result)else:file_handle_eval.write(str_Result)i += 1file_handle_train.close()file_handle_eval.close()path = './'
res = os.listdir(path)
print(res)
with open("train.txt","w") as f:for i in res:if(os.path.isdir(i)):path1 = path + ires2 = os.listdir(path1)for j in res2:f.write(path1+"/"+j+" " + i +'\n')listFileInfo = ReadFileDatas()
#打乱列表中的顺序
random.shuffle(listFileInfo)
WriteDatasToFile(listFileInfo)

模型训练

借助于PaddleX,模型训练变得非常简单,主要分为数据集定义,数据增强算子定义,模型定义和模型训练四个步骤:

from paddlex import transforms as T
import paddlex as pdxtrain_transforms = T.Compose([          #定义训练集的数据增强算子T.RandomCrop(crop_size=224),T.RandomHorizontalFlip(),T.Normalize()])eval_transforms = T.Compose([			#定义评价集的数据增强算子T.ResizeByShort(short_size=256),T.CenterCrop(crop_size=224),T.Normalize()
])train_dataset = pdx.datasets.ImageNet(		#定义训练集data_dir='rubbish',file_list='rubbish/train.txt',label_list='rubbish/labels.txt',transforms=train_transforms,shuffle=True)
eval_dataset = pdx.datasets.ImageNet(		#定义评价集data_dir='rubbish',file_list='rubbish/eval.txt',label_list='rubbish/labels.txt',transforms=eval_transforms)num_classes = len(train_dataset.labels)
model = pdx.cls.MobileNetV3_small(num_classes=num_classes)		#定义分类模型model.train(num_epochs=10,										#模型训练train_dataset=train_dataset,train_batch_size=64,eval_dataset=eval_dataset,lr_decay_epochs=[4, 6, 8],save_dir='output/mobilenetv3_small',use_vdl=True)

具体参数的含义可以参照PaddleX的Github文档,在B站视频中也做了详细的讲解。

模型的预测

import paddlex as pdx
model = pdx.load_model('output/mobilenetv3_small/best_model')
result = model.predict('188.jpg')
print("Predict Result: ", result)

可以观察输出的结果是否正确。

模型训练的可视化

visualdl --logdir output/mobilenetv3_small --port 8001

打开浏览器输出网址,可以看到训练的各个参数曲线

这篇关于基于Paddle的计算机视觉入门教程——第5讲 实战:PaddleX实现垃圾分类的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/550213

相关文章

Python在二进制文件中进行数据搜索的实战指南

《Python在二进制文件中进行数据搜索的实战指南》在二进制文件中搜索特定数据是编程中常见的任务,尤其在日志分析、程序调试和二进制数据处理中尤为重要,下面我们就来看看如何使用Python实现这一功能吧... 目录简介1. 二进制文件搜索概述2. python二进制模式文件读取(rb)2.1 二进制模式与文本

基于C++的UDP网络通信系统设计与实现详解

《基于C++的UDP网络通信系统设计与实现详解》在网络编程领域,UDP作为一种无连接的传输层协议,以其高效、低延迟的特性在实时性要求高的应用场景中占据重要地位,下面我们就来看看如何从零开始构建一个完整... 目录前言一、UDP服务器UdpServer.hpp1.1 基本框架设计1.2 初始化函数Init详解

Java中Map的五种遍历方式实现与对比

《Java中Map的五种遍历方式实现与对比》其实Map遍历藏着多种玩法,有的优雅简洁,有的性能拉满,今天咱们盘一盘这些进阶偏基础的遍历方式,告别重复又臃肿的代码,感兴趣的小伙伴可以了解下... 目录一、先搞懂:Map遍历的核心目标二、几种遍历方式的对比1. 传统EntrySet遍历(最通用)2. Lambd

Django调用外部Python程序的完整项目实战

《Django调用外部Python程序的完整项目实战》Django是一个强大的PythonWeb框架,它的设计理念简洁优雅,:本文主要介绍Django调用外部Python程序的完整项目实战,文中通... 目录一、为什么 Django 需要调用外部 python 程序二、三种常见的调用方式方式 1:直接 im

springboot+redis实现订单过期(超时取消)功能的方法详解

《springboot+redis实现订单过期(超时取消)功能的方法详解》在SpringBoot中使用Redis实现订单过期(超时取消)功能,有多种成熟方案,本文为大家整理了几个详细方法,文中的示例代... 目录一、Redis键过期回调方案(推荐)1. 配置Redis监听器2. 监听键过期事件3. Redi

SpringBoot全局异常拦截与自定义错误页面实现过程解读

《SpringBoot全局异常拦截与自定义错误页面实现过程解读》本文介绍了SpringBoot中全局异常拦截与自定义错误页面的实现方法,包括异常的分类、SpringBoot默认异常处理机制、全局异常拦... 目录一、引言二、Spring Boot异常处理基础2.1 异常的分类2.2 Spring Boot默

基于SpringBoot实现分布式锁的三种方法

《基于SpringBoot实现分布式锁的三种方法》这篇文章主要为大家详细介绍了基于SpringBoot实现分布式锁的三种方法,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、基于Redis原生命令实现分布式锁1. 基础版Redis分布式锁2. 可重入锁实现二、使用Redisso

SpringBoo WebFlux+MongoDB实现非阻塞API过程

《SpringBooWebFlux+MongoDB实现非阻塞API过程》本文介绍了如何使用SpringBootWebFlux和MongoDB实现非阻塞API,通过响应式编程提高系统的吞吐量和响应性能... 目录一、引言二、响应式编程基础2.1 响应式编程概念2.2 响应式编程的优势2.3 响应式编程相关技术

C#实现将XML数据自动化地写入Excel文件

《C#实现将XML数据自动化地写入Excel文件》在现代企业级应用中,数据处理与报表生成是核心环节,本文将深入探讨如何利用C#和一款优秀的库,将XML数据自动化地写入Excel文件,有需要的小伙伴可以... 目录理解XML数据结构与Excel的对应关系引入高效工具:使用Spire.XLS for .NETC

Nginx更新SSL证书的实现步骤

《Nginx更新SSL证书的实现步骤》本文主要介绍了Nginx更新SSL证书的实现步骤,包括下载新证书、备份旧证书、配置新证书、验证配置及遇到问题时的解决方法,感兴趣的了解一下... 目录1 下载最新的SSL证书文件2 备份旧的SSL证书文件3 配置新证书4 验证配置5 遇到的http://www.cppc