TAO toolkit 训练UNET 踩坑记录 解决mask与image无法对齐问题

2023-11-07 18:44

本文主要是介绍TAO toolkit 训练UNET 踩坑记录 解决mask与image无法对齐问题,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

先说结论,如果在使用TAO 训练Unet时候发生image与mask没有对齐(配对混乱),要自己写train_image.txt 那几个txt文件,注意文件内图片的顺序务必 train 的image 和mask 保持一致。

1. TAO框架白话介绍:

        TAO toolkit 简单来说是一个基于 tao(python端软件)+ nvidia docker(对应tao容器)的一个工具集合,主要用于跑模型训练、剪枝量化、模型输出、数据集处理的框架,优势是不用安装那么多依赖,只需要搭建一个nvidiadocker的环境请参考TAO Toolkit Quick Start Guide - NVIDIA Docs进行安装(请注意,nvidiadocker目前是2版本了,安装过程跟网上的可能不同)在拉起的容器内就可以做这些工作省去各种麻烦的依赖安装步骤。

        TAO框架有几个典型的容器 tensorflow2 tensorflow1 以及pytorch 三个(如果不是定制没啥区别,我本来用pytorch的,误拉起TF1的容器也是一样的操作没区别)

正文开始:

1. 安装的坑:

        1.1 如果你在标准UBUNTU上安装,可能会遇到docker启动时候需要sudo的问题,这块需要注意,如果不像每次启动都sudo需要上网查一下

        1.2 安装NGC时候 提示的password 实际上是生成的apikey 需要在提示的网址那边去生成一个。

2. 启动的坑:

        2.1 tao启动命令里的参数对应的文件路径,都是容器内的路径,不是本机路径哦

        2.2 在sudo情况下.tao_mounts.json 要放到/root文件夹下:   由于我这边没有root用户权限(只有sudo权限 不能su),每次启动tao时候都是用 sudo tao xx来启动的,在教程中将配置文件.tao_mounts.json 放到~/ 这一步 在我这里就变成了 要放到/root用户下 默认的~/ 是home文件夹  这里要注意,不然你会发现容器起来以后总说各种文件找不到。

3. NGC下载东西要科学 上 网...

4. 针对UNET 的坑:

        1. 数据集按照说明是有两种格式的(其实只有第二种能用) :1. 利用txt文件索引  2.按照预定的格式存放,这里注意,第二种我试过了,试了一周都不行,各种问题(主要是乱套了,mask跟image对不上),直接用 TXT文件索引,注意mask 和 image 这两个文件的顺序要对上。txt文件内的文件路径要是容器内的路径,这里要参考.tao_mounts.json的映射来确定路径哦!

        2. 配置 config.txt时候(教程里放到specs那个)的data_clase_config时候 label_id 要跟mask文件中的你要的部分的对应像素值对应 例如我的标注 黑色是背景,白色是要提取的东西 则需要这样写   data_class_config {
    target_classes {
      name: "foreground"
      mapping_class: "foreground"
      label_id: 255
    }
    target_classes {
      name: "background"
      mapping_class: "background"
      label_id: 0
    }
  }

如果单张MASK中有多个类别,则需要不同的类是不同像素值 例如 猫咪 狗狗 背景 则应该是 255 128 0 在这个mask文件中有三个值(不必是0就是背景,只要对应上就ok)。与cityscapes 标注类型中的 _idLabels.png中是一样的,在config中的target_classes的label_id 设置为 255 128 0 这三个值 

3. mask 对应的图片格式应该是 PIL图像中的"L" 而不是 "1" 

4. 在使用 三色图片时候 config 中 input_image_type: "color"

5. 在training_config中添加 visualizer{
                                                    enabled:true
                                              }  可以开启tensorboard 对debug很有用

这篇关于TAO toolkit 训练UNET 踩坑记录 解决mask与image无法对齐问题的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/365577

相关文章

Springboot项目启动失败提示找不到dao类的解决

《Springboot项目启动失败提示找不到dao类的解决》SpringBoot启动失败,因ProductServiceImpl未正确注入ProductDao,原因:Dao未注册为Bean,解决:在启... 目录错误描述原因解决方法总结***************************APPLICA编

解决pandas无法读取csv文件数据的问题

《解决pandas无法读取csv文件数据的问题》本文讲述作者用Pandas读取CSV文件时因参数设置不当导致数据错位,通过调整delimiter和on_bad_lines参数最终解决问题,并强调正确参... 目录一、前言二、问题复现1. 问题2. 通过 on_bad_lines=‘warn’ 跳过异常数据3

java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)

《java中pdf模版填充表单踩坑实战记录(itextPdf、openPdf、pdfbox)》:本文主要介绍java中pdf模版填充表单踩坑的相关资料,OpenPDF、iText、PDFBox是三... 目录准备Pdf模版方法1:itextpdf7填充表单(1)加入依赖(2)代码(3)遇到的问题方法2:pd

解决RocketMQ的幂等性问题

《解决RocketMQ的幂等性问题》重复消费因调用链路长、消息发送超时或消费者故障导致,通过生产者消息查询、Redis缓存及消费者唯一主键可以确保幂等性,避免重复处理,本文主要介绍了解决RocketM... 目录造成重复消费的原因解决方法生产者端消费者端代码实现造成重复消费的原因当系统的调用链路比较长的时

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

SpringBoot监控API请求耗时的6中解决解决方案

《SpringBoot监控API请求耗时的6中解决解决方案》本文介绍SpringBoot中记录API请求耗时的6种方案,包括手动埋点、AOP切面、拦截器、Filter、事件监听、Micrometer+... 目录1. 简介2.实战案例2.1 手动记录2.2 自定义AOP记录2.3 拦截器技术2.4 使用Fi

kkFileView启动报错:报错2003端口占用的问题及解决

《kkFileView启动报错:报错2003端口占用的问题及解决》kkFileView启动报错因office组件2003端口未关闭,解决:查杀占用端口的进程,终止Java进程,使用shutdown.s... 目录原因解决总结kkFileViewjavascript启动报错启动office组件失败,请检查of

SQL Server安装时候没有中文选项的解决方法

《SQLServer安装时候没有中文选项的解决方法》用户安装SQLServer时界面全英文,无中文选项,通过修改安装设置中的国家或地区为中文中国,重启安装程序后界面恢复中文,解决了问题,对SQLSe... 你是不是在安装SQL Server时候发现安装界面和别人不同,并且无论如何都没有中文选项?这个问题也

SpringBoot 异常处理/自定义格式校验的问题实例详解

《SpringBoot异常处理/自定义格式校验的问题实例详解》文章探讨SpringBoot中自定义注解校验问题,区分参数级与类级约束触发的异常类型,建议通过@RestControllerAdvice... 目录1. 问题简要描述2. 异常触发1) 参数级别约束2) 类级别约束3. 异常处理1) 字段级别约束

java内存泄漏排查过程及解决

《java内存泄漏排查过程及解决》公司某服务内存持续增长,疑似内存泄漏,未触发OOM,排查方法包括检查JVM配置、分析GC执行状态、导出堆内存快照并用IDEAProfiler工具定位大对象及代码... 目录内存泄漏内存问题排查1.查看JVM内存配置2.分析gc是否正常执行3.导出 dump 各种工具分析4.