分类数据集踩坑记录,Caltech256,你礼貌吗?

2023-12-01 18:40

本文主要是介绍分类数据集踩坑记录,Caltech256,你礼貌吗?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

本博客记录一下在Caltech256数据集中遇到的一些坑。
Caltech256主页,以及博主提供的免费数据集下载链接。

踩坑1:
waring:torchvision提供的标签信息与实际下载的数据集不匹配,数据集加载出错
标签文件与数据集不匹配,标签文件长达30609,但实际图片为30607张(官方数据)。判断了下所有文件是否存在,出现两个奇葩index找不到文件。

train_set = datasets.Caltech256(root=data_folder,download=True,# train=True,transform=train_transform)
for i in range(len(train_set.index)):if not os.path.exists(os.path.join(root,"256_ObjectCategories",train_set.categories[train_set.y[i]],"{:03d}_{:04d}.jpg".format(train_set.y[i] + 1, train_set.index[i]))):print(i)

在这里插入图片描述
解决方案:

    train_set.index = train_set.index[:6307] + train_set.index[6308:22619] + train_set.index[22620:]train_set.y = train_set.y[:6307] + train_set.y[6308:22619] + train_set.y[22620:]

踩坑2:
waring:总类别为257,使用错误的类别将会导致预测概率为负,损失计算为NaN等无厘头错误。

n_cls = 256  #错误类别
n_cls = 257  #正确类别

在这里插入图片描述

踩坑3:

waring:部分图片为单通道,直接使用transforms进行标准化将会报错。

顺便把标准化参数也在这公布一下吧,同学们以后就不用自己再算一遍了。

# 三通道均值和标准差分别为:
0.5520 0.5336 0.5050
0.2353 0.2345 0.2372

解决方案:
通过路径读取图片后先将img转换为tensor,并判断tensor是不是单通道,如果单通道则直接复制为3通道。确保所有img为3通道之后再进行标准化和resize等操作。

img = Image.open(img_path)  # 读取该图片img = transforms.Compose([transforms.ToTensor()])(img)if self.transform is not None:if img.shape[0] != 3:img = img.repeat(3, 1, 1)img = self.transform(img)      

暂时记录到这啦

这篇关于分类数据集踩坑记录,Caltech256,你礼貌吗?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/442259

相关文章

SpringBoot多环境配置数据读取方式

《SpringBoot多环境配置数据读取方式》SpringBoot通过环境隔离机制,支持properties/yaml/yml多格式配置,结合@Value、Environment和@Configura... 目录一、多环境配置的核心思路二、3种配置文件格式详解2.1 properties格式(传统格式)1.

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)

《java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)》:本文主要介绍java中pdf模版填充表单踩坑的相关资料,OpenPDF、iText、PDFBox是三... 目录准备Pdf模版方法1:itextpdf7填充表单(1)加入依赖(2)代码(3)遇到的问题方法2:pd

C#监听txt文档获取新数据方式

《C#监听txt文档获取新数据方式》文章介绍通过监听txt文件获取最新数据,并实现开机自启动、禁用窗口关闭按钮、阻止Ctrl+C中断及防止程序退出等功能,代码整合于主函数中,供参考学习... 目录前言一、监听txt文档增加数据二、其他功能1. 设置开机自启动2. 禁止控制台窗口关闭按钮3. 阻止Ctrl +

java如何实现高并发场景下三级缓存的数据一致性

《java如何实现高并发场景下三级缓存的数据一致性》这篇文章主要为大家详细介绍了java如何实现高并发场景下三级缓存的数据一致性,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 下面代码是一个使用Java和Redisson实现的三级缓存服务,主要功能包括:1.缓存结构:本地缓存:使

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

《在MySQL中实现冷热数据分离的方法及使用场景底层原理解析》MySQL冷热数据分离通过分表/分区策略、数据归档和索引优化,将频繁访问的热数据与冷数据分开存储,提升查询效率并降低存储成本,适用于高并发... 目录实现冷热数据分离1. 分表策略2. 使用分区表3. 数据归档与迁移在mysql中实现冷热数据分

C#解析JSON数据全攻略指南

《C#解析JSON数据全攻略指南》这篇文章主要为大家详细介绍了使用C#解析JSON数据全攻略指南,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、为什么jsON是C#开发必修课?二、四步搞定网络JSON数据1. 获取数据 - HttpClient最佳实践2. 动态解析 - 快速

Zabbix在MySQL性能监控方面的运用及最佳实践记录

《Zabbix在MySQL性能监控方面的运用及最佳实践记录》Zabbix通过自定义脚本和内置模板监控MySQL核心指标(连接、查询、资源、复制),支持自动发现多实例及告警通知,结合可视化仪表盘,可有效... 目录一、核心监控指标及配置1. 关键监控指标示例2. 配置方法二、自动发现与多实例管理1. 实践步骤

MyBatis-Plus通用中等、大量数据分批查询和处理方法

《MyBatis-Plus通用中等、大量数据分批查询和处理方法》文章介绍MyBatis-Plus分页查询处理,通过函数式接口与Lambda表达式实现通用逻辑,方法抽象但功能强大,建议扩展分批处理及流式... 目录函数式接口获取分页数据接口数据处理接口通用逻辑工具类使用方法简单查询自定义查询方法总结函数式接口

SQL中如何添加数据(常见方法及示例)

《SQL中如何添加数据(常见方法及示例)》SQL全称为StructuredQueryLanguage,是一种用于管理关系数据库的标准编程语言,下面给大家介绍SQL中如何添加数据,感兴趣的朋友一起看看吧... 目录在mysql中,有多种方法可以添加数据。以下是一些常见的方法及其示例。1. 使用INSERT I