搭建解决三好学生成绩问题的神经网络02---训练神经网络

2024-01-19 06:10

本文主要是介绍搭建解决三好学生成绩问题的神经网络02---训练神经网络,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言:

       我们在https://blog.csdn.net/qq_39432161/article/details/100858574中介绍了三好学生成绩问题,搭建了初步的神经网络模型。但是没有进行循环训练神经网络模型,现在我们要对上一节中的神经网络模型进行训练。

训练神经网络模型步骤:

  1. 输入数据:x1,x2,x3即两个学生的德育、智育、体育各项的成绩
  2. 计算结果:神经网络根据输入的数据和当前的可变参数值计算出结果(y)
  3. 计算误差:将计算出来的结果y与我期待的结果(或者说标准答案(yTrain))进行比对,看看误差(loss)是多少。yTrain在三好学生问题中表示两个学生的各自总分。
  4. 调整神经网络的可变参数:根据误差的大小,使用反向传播算法,对神经网络中的可变参数进行调节(本问题中的w1,w2,w3)
  5. 再次训练:在调节可变参数后,重复上述步骤,直到误差低于我们理想水平。

                                    神经网络训练流程图

代码实现:

  1. 在上一个模型的基础上,我们添加了目标值yTrain = tf.placeholder(dtype=tf.float32)和训练误差loss = abs(y - yTrain)。
  2. 定义一个优化器变量optimizer。优化器:用来调整神经网络可变参数的对象,TensorFlow中有许多优化器,我们选用的是AlphaGo使用的优化器RMSPropOptimize。这个优化器是通过调用tf.train.RMSPropOptimizer()函数来实现,其中参数0.001是这个优化器的学习率(learn rate),学习率决定优化器每次调整参数的幅度大小。
  3. 定义完优化器,我们定义一个训练对象train(代表我们准备如何训练这个神经网络),我们把train对象定义为optimzer.minimize(loss),也就是说要求优化器按照把loss最小化(minimize)的原则来调整可变参数。
# Author:北京
# QQ:838262020
# time:2019/9/13
import tensorflow as tfx1 = tf.placeholder(dtype=tf.float32)
x2 = tf.placeholder(dtype=tf.float32)
x3 = tf.placeholder(dtype=tf.float32)# 添加一个目标值 
yTrain = tf.placeholder(dtype=tf.float32)w1 = tf.Variable(0.1, dtype=tf.float32)
w2 = tf.Variable(0.1, dtype=tf.float32)
w3 = tf.Variable(0.1, dtype=tf.float32)n1 = x1 * w1
n2 = x2 * w2
n3 = x3 * w3y = n1 + n2 + n3# 训练值和目标值的绝对值差
loss = abs(y - yTrain)# 使用RMSPropOptimzer优化器 
optimzer = tf.train.RMSPropOptimizer(0.001)# 按照最小化的原则处理loss
train = optimzer.minimize(loss)sess = tf.Session()
init = tf.global_variables_initializer()
sess.run(init)result1 = sess.run([train, x1, x2, x3, w1, w2, w3, y, yTrain, loss], feed_dict={x1: 90, x2: 80, x3: 85, yTrain: 85})
print(result1)
result2 = sess.run([train, x1, x2, x3, w1, w2, w3, y, yTrain, loss], feed_dict={x1: 98, x2: 95, x3: 87, yTrain: 96})
print(result2)

 运行结果:

[None, array(90.0, dtype=float32), array(80.0, dtype=float32), array(70.0, dtype=float32), 0.10316052, 0.10316006, 0.10315938, 24.0, array(85.0, dtype=float32), 61.0]
[None, array(98.0, dtype=float32), array(95.0, dtype=float32), array(87.0, dtype=float32), 0.10554425, 0.10563005, 0.1056722, 28.884804, array(96.0, dtype=float32), 67.115196]

 

这篇关于搭建解决三好学生成绩问题的神经网络02---训练神经网络的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/621474

相关文章

Java中读取YAML文件配置信息常见问题及解决方法

《Java中读取YAML文件配置信息常见问题及解决方法》:本文主要介绍Java中读取YAML文件配置信息常见问题及解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要... 目录1 使用Spring Boot的@ConfigurationProperties2. 使用@Valu

SQL Server配置管理器无法打开的四种解决方法

《SQLServer配置管理器无法打开的四种解决方法》本文总结了SQLServer配置管理器无法打开的四种解决方法,文中通过图文示例介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录方法一:桌面图标进入方法二:运行窗口进入检查版本号对照表php方法三:查找文件路径方法四:检查 S

怎样通过分析GC日志来定位Java进程的内存问题

《怎样通过分析GC日志来定位Java进程的内存问题》:本文主要介绍怎样通过分析GC日志来定位Java进程的内存问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、GC 日志基础配置1. 启用详细 GC 日志2. 不同收集器的日志格式二、关键指标与分析维度1.

Java 线程安全与 volatile与单例模式问题及解决方案

《Java线程安全与volatile与单例模式问题及解决方案》文章主要讲解线程安全问题的五个成因(调度随机、变量修改、非原子操作、内存可见性、指令重排序)及解决方案,强调使用volatile关键字... 目录什么是线程安全线程安全问题的产生与解决方案线程的调度是随机的多个线程对同一个变量进行修改线程的修改操

Redis出现中文乱码的问题及解决

《Redis出现中文乱码的问题及解决》:本文主要介绍Redis出现中文乱码的问题及解决,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1. 问题的产生2China编程. 问题的解决redihttp://www.chinasem.cns数据进制问题的解决中文乱码问题解决总结

全面解析MySQL索引长度限制问题与解决方案

《全面解析MySQL索引长度限制问题与解决方案》MySQL对索引长度设限是为了保持高效的数据检索性能,这个限制不是MySQL的缺陷,而是数据库设计中的权衡结果,下面我们就来看看如何解决这一问题吧... 目录引言:为什么会有索引键长度问题?一、问题根源深度解析mysql索引长度限制原理实际场景示例二、五大解决

Springboot如何正确使用AOP问题

《Springboot如何正确使用AOP问题》:本文主要介绍Springboot如何正确使用AOP问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录​一、AOP概念二、切点表达式​execution表达式案例三、AOP通知四、springboot中使用AOP导出

Python中Tensorflow无法调用GPU问题的解决方法

《Python中Tensorflow无法调用GPU问题的解决方法》文章详解如何解决TensorFlow在Windows无法识别GPU的问题,需降级至2.10版本,安装匹配CUDA11.2和cuDNN... 当用以下代码查看GPU数量时,gpuspython返回的是一个空列表,说明tensorflow没有找到

解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘问题

《解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘问题》:本文主要介绍解决未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4... 目录未解析的依赖项:‘net.sf.json-lib:json-lib:jar:2.4‘打开pom.XM

XML重复查询一条Sql语句的解决方法

《XML重复查询一条Sql语句的解决方法》文章分析了XML重复查询与日志失效问题,指出因DTO缺少@Data注解导致日志无法格式化、空指针风险及参数穿透,进而引发性能灾难,解决方案为在Controll... 目录一、核心问题:从SQL重复执行到日志失效二、根因剖析:DTO断裂引发的级联故障三、解决方案:修复