基于tensorflow2、CNN的手写数字识别项目

2024-03-16 17:10

本文主要是介绍基于tensorflow2、CNN的手写数字识别项目,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

手写数字识别实战——基于tensorflow2、CNN

项目说明

该手写数字识别实战是基于tensorflow2的深度学习项目,使用tensorflow自带的MNIST手写数据集作为数据集,使用了CNN网络,最后使用模型预测手写图片。

项目环境

基础环境:python+anaconda
框架:tensorflow2

实现步骤

一、数据处理


import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt"""
数据处理
"""
# 加载MNIST
mnist = tf.keras.datasets.mnist
# 加载MNIST数据集为训练集和测试集
(x_train, y_train), (x_test, y_test) = mnist.load_data()
# 归一化操作
x_train, x_test = x_train / 255., x_test / 255.
# 增加维度
x_train = tf.expand_dims(x_train, -1)
x_test = tf.expand_dims(x_test, -1)
# 转换为one-hot编码
y_train = np.float32(tf.keras.utils.to_categorical(y_train, num_classes=10))
y_test = np.float32(tf.keras.utils.to_categorical(y_test, num_classes=10))
# 设置批量大小
batch_size = 256
# 载入数据为dataset
train_dataset = tf.data.Dataset.from_tensor_slices((x_train, y_train)).batch(batch_size).shuffle(batch_size * 10)
test_dataset = tf.data.Dataset.from_tensor_slices((x_test, y_test)).batch(batch_size)

二、搭建网络

"""
搭建网络
"""
# 输入
input_img=tf.keras.Input([28,28,1])
# 第一层卷积
conv1=tf.keras.layers.Conv2D(filters=32,kernel_size=3,padding='SAME',activation=tf.nn.relu)(input_img)
# 第二层卷积
conv2=tf.keras.layers.Conv2D(filters=64,kernel_size=3,padding='SAME',activation=tf.nn.relu)(conv1)
# 最大池化
pool=tf.keras.layers.MaxPool2D(pool_size=2,strides=2)(conv2)
# 第三层卷积
conv3=tf.keras.layers.Conv2D(filters=128,kernel_size=3,padding='SAME',activation=tf.nn.relu)(pool)
# flatten拉平
flat=tf.keras.layers.Flatten()(conv3)
# 全连接层
dense1=tf.keras.layers.Dense(units=512,activation=tf.nn.relu)(flat)
# 全连接层
dense2=tf.keras.layers.Dense(units=10,activation=tf.nn.softmax)(dense1)
# 指定模型的输入和输出
model=tf.keras.Model(inputs=input_img,outputs=dense2)
model.summary()	#查看网络结构

三、模型训练及评估

"""
模型训练及评估
"""
# 配置训练方法
model.compile(optimizer=tf.optimizers.Adam(learning_rate=1e-3),loss='categorical_crossentropy',metrics=['accuracy'])
# 执行训练过程
model.fit(train_dataset,epochs=10)
# 模型评估
score=model.evaluate(test_dataset)
print('last score:',score)
# 保存模型
model.save('model.h5')

四、预测单张手写数字

import tensorflow as tf
import numpy as np
import cv2def img_show(img):          # 展示图片cv2.imshow('img',img)cv2.waitKey(0)"""
单张数字图片预测
"""# 读取图片
img=cv2.imread('./detect_img/6.png')	# 传入待预测图片
# print(img.shape)
# img_show(img)
# 转灰度图
img=cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)
# img_show(img)
# 改变尺寸
img=cv2.resize(img,(28,28))
# img_show(img)
# 转黑底白字、归一化
img=(255-img)/255
# img_show(img)
# 转为4维
img= img.reshape((1,28,28,1))
# print(img.shape)
# 加载模型
model = tf.keras.models.load_model('model.h5')
# 预测
probabilities = model.predict(img)
print(probabilities)
prediction = np.argmax(probabilities)
prediction_values =np.max(probabilities)
print('预测:  结果:{}  概率:{:.2%}'.format(prediction,prediction_values))

最终效果

待预测手写数字图片:
在这里插入图片描述

预测结果:
在这里插入图片描述

多张预测:
在这里插入图片描述

存在问题

有些时候预测不准,尤其是0、8、6;
有大佬希望可以帮忙看看!!万分感谢!

参考资料:
MNSIT:https://zhuanlan.zhihu.com/p/36592188
代码参考:https://blog.csdn.net/woshinierye/article/details/105141631

这篇关于基于tensorflow2、CNN的手写数字识别项目的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/816143

相关文章

Three.js构建一个 3D 商品展示空间完整实战项目

《Three.js构建一个3D商品展示空间完整实战项目》Three.js是一个强大的JavaScript库,专用于在Web浏览器中创建3D图形,:本文主要介绍Three.js构建一个3D商品展... 目录引言项目核心技术1. 项目架构与资源组织2. 多模型切换、交互热点绑定3. 移动端适配与帧率优化4. 可

sky-take-out项目中Redis的使用示例详解

《sky-take-out项目中Redis的使用示例详解》SpringCache是Spring的缓存抽象层,通过注解简化缓存管理,支持Redis等提供者,适用于方法结果缓存、更新和删除操作,但无法实现... 目录Spring Cache主要特性核心注解1.@Cacheable2.@CachePut3.@Ca

SpringBoot通过main方法启动web项目实践

《SpringBoot通过main方法启动web项目实践》SpringBoot通过SpringApplication.run()启动Web项目,自动推断应用类型,加载初始化器与监听器,配置Spring... 目录1. 启动入口:SpringApplication.run()2. SpringApplicat

Springboot项目构建时各种依赖详细介绍与依赖关系说明详解

《Springboot项目构建时各种依赖详细介绍与依赖关系说明详解》SpringBoot通过spring-boot-dependencies统一依赖版本管理,spring-boot-starter-w... 目录一、spring-boot-dependencies1.简介2. 内容概览3.核心内容结构4.

在ASP.NET项目中如何使用C#生成二维码

《在ASP.NET项目中如何使用C#生成二维码》二维码(QRCode)已广泛应用于网址分享,支付链接等场景,本文将以ASP.NET为示例,演示如何实现输入文本/URL,生成二维码,在线显示与下载的完整... 目录创建前端页面(Index.cshtml)后端二维码生成逻辑(Index.cshtml.cs)总结

基于Python实现数字限制在指定范围内的五种方式

《基于Python实现数字限制在指定范围内的五种方式》在编程中,数字范围限制是常见需求,无论是游戏开发中的角色属性值、金融计算中的利率调整,还是传感器数据处理中的异常值过滤,都需要将数字控制在合理范围... 目录引言一、基础条件判断法二、数学运算巧解法三、装饰器模式法四、自定义类封装法五、NumPy数组处理

Spring Boot项目如何使用外部application.yml配置文件启动JAR包

《SpringBoot项目如何使用外部application.yml配置文件启动JAR包》文章介绍了SpringBoot项目通过指定外部application.yml配置文件启动JAR包的方法,包括... 目录Spring Boot项目中使用外部application.yml配置文件启动JAR包一、基本原理

Springboot项目登录校验功能实现

《Springboot项目登录校验功能实现》本文介绍了Web登录校验的重要性,对比了Cookie、Session和JWT三种会话技术,分析其优缺点,并讲解了过滤器与拦截器的统一拦截方案,推荐使用JWT... 目录引言一、登录校验的基本概念二、HTTP协议的无状态性三、会话跟android踪技术1. Cook

springboot项目中集成shiro+jwt完整实例代码

《springboot项目中集成shiro+jwt完整实例代码》本文详细介绍如何在项目中集成Shiro和JWT,实现用户登录校验、token携带及接口权限管理,涉及自定义Realm、ModularRe... 目录简介目的需要的jar集成过程1.配置shiro2.创建自定义Realm2.1 LoginReal

idea Maven Springboot多模块项目打包时90%的问题及解决方案

《ideaMavenSpringboot多模块项目打包时90%的问题及解决方案》:本文主要介绍ideaMavenSpringboot多模块项目打包时90%的问题及解决方案,具有很好的参考价值,... 目录1. 前言2. 问题3. 解决办法4. jar 包冲突总结1. 前言之所以写这篇文章是因为在使用Mav