【超分辨率MSRN代码问题/PyTorch-二】中断训练后从停止的epoch继续训练

2023-12-23 15:58

本文主要是介绍【超分辨率MSRN代码问题/PyTorch-二】中断训练后从停止的epoch继续训练,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

当我不小心中断训练后,想继续训练时,发现MSRN代码有挺多问题啊。。

1. 首先想继续训练的话,运行主文件时的参数要从原来给的

python main.py --template MSRN --save MSRN_X2 --scale 2 --reset --save_results --patch_size 96 --ext sep_reset

修改成

python main.py --template MSRN --load MSRN_X2 --resume -1 --scale 2 --save_results --patch_size 96 --ext sep

也就是删除参数save及reset,添加参数loadresume的默认值

重要参数的作用:(主要位于在utility.py中的checkpoint函数)

--save:设置本次训练保存实验结果的文件夹。没有修改load参数默认值时起作用。

--load:设置本次训练要加载的已有实验结果的文件夹。

--reset:删除save和load参数中的文件夹,若其中有之前的训练结果也会删掉,并重建空文件夹。

--resume:为-1时,可上面设置的文件夹中的model_latest.pt开始训练;

                   为0(默认值)时,若pre_train值为点则从头开始训练,若有其它值,则从模型pre_train开始训练;

                   为其他值时,从model_{resume}.pt开始恢复训练

 

2. 修改完上述参数后可以训练,但发现比如从epoch514开始训练,学习速率lr本应该是2.5e-5,但却显示6.25e-6

应该将trainer.py中的28行左右

for _ in range(len(ckp.log)): self.scheduler.step()

修改为

self.scheduler.last_epoch = len(ckp.log)

原因:在设置load参数后,会从optimizer.pt中加载上次训练中断时epoch(比如514)的lr,此时lr已经是2.5e-5了,然而接下来源代码的for循环要循环514下,会在2.5e-5的基础上再降低两次gamma倍的lr(每200epoch乘以gamma)。

这篇关于【超分辨率MSRN代码问题/PyTorch-二】中断训练后从停止的epoch继续训练的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/528592

相关文章

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

Java 线程安全与 volatile与单例模式问题及解决方案

《Java线程安全与volatile与单例模式问题及解决方案》文章主要讲解线程安全问题的五个成因(调度随机、变量修改、非原子操作、内存可见性、指令重排序)及解决方案,强调使用volatile关键字... 目录什么是线程安全线程安全问题的产生与解决方案线程的调度是随机的多个线程对同一个变量进行修改线程的修改操

Redis出现中文乱码的问题及解决

《Redis出现中文乱码的问题及解决》:本文主要介绍Redis出现中文乱码的问题及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1. 问题的产生2China编程. 问题的解决redihttp://www.chinasem.cns数据进制问题的解决中文乱码问题解决总结

Java中调用数据库存储过程的示例代码

《Java中调用数据库存储过程的示例代码》本文介绍Java通过JDBC调用数据库存储过程的方法,涵盖参数类型、执行步骤及数据库差异,需注意异常处理与资源管理,以优化性能并实现复杂业务逻辑,感兴趣的朋友... 目录一、存储过程概述二、Java调用存储过程的基本javascript步骤三、Java调用存储过程示

Visual Studio 2022 编译C++20代码的图文步骤

《VisualStudio2022编译C++20代码的图文步骤》在VisualStudio中启用C++20import功能,需设置语言标准为ISOC++20,开启扫描源查找模块依赖及实验性标... 默认创建Visual Studio桌面控制台项目代码包含C++20的import方法。右键项目的属性:

全面解析MySQL索引长度限制问题与解决方案

《全面解析MySQL索引长度限制问题与解决方案》MySQL对索引长度设限是为了保持高效的数据检索性能,这个限制不是MySQL的缺陷,而是数据库设计中的权衡结果,下面我们就来看看如何解决这一问题吧... 目录引言:为什么会有索引键长度问题?一、问题根源深度解析mysql索引长度限制原理实际场景示例二、五大解决

Springboot如何正确使用AOP问题

《Springboot如何正确使用AOP问题》:本文主要介绍Springboot如何正确使用AOP问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录​一、AOP概念二、切点表达式​execution表达式案例三、AOP通知四、springboot中使用AOP导出

MySQL数据库的内嵌函数和联合查询实例代码

《MySQL数据库的内嵌函数和联合查询实例代码》联合查询是一种将多个查询结果组合在一起的方法,通常使用UNION、UNIONALL、INTERSECT和EXCEPT关键字,下面:本文主要介绍MyS... 目录一.数据库的内嵌函数1.1聚合函数COUNT([DISTINCT] expr)SUM([DISTIN

Python中Tensorflow无法调用GPU问题的解决方法

《Python中Tensorflow无法调用GPU问题的解决方法》文章详解如何解决TensorFlow在Windows无法识别GPU的问题,需降级至2.10版本,安装匹配CUDA11.2和cuDNN... 当用以下代码查看GPU数量时,gpuspython返回的是一个空列表,说明tensorflow没有找到

解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘问题

《解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘问题》:本文主要介绍解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4... 目录未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘打开pom.XM