字符是识别---11--源数据20*20--训练样本0~Z----基于TensorFlow+CNN实现

2024-06-09 07:48

本文主要是介绍字符是识别---11--源数据20*20--训练样本0~Z----基于TensorFlow+CNN实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 

#coding=utf-8import os
#图像读取库
from PIL import Image
#矩阵运算库
import numpy as np
import tensorflow as tf# 训练还是测试
train = True #True False
# 数据文件夹
if train:data_dir = "data"
else:data_dir = "test"
# 模型文件路径
model_path = "model/image_model"# 从文件夹读取图片和标签到numpy数组中
# 标签信息在文件名中,例如1_40.jpg表示该图片的标签为1
def read_data(data_dir):datas = []labels = []fpaths = []for fname in os.listdir(data_dir):fpath = os.path.join(data_dir, fname)fpaths.append(fpath)image = Image.open(fpath)print(fpath)data = np.array(image) / 255.0label = int(fname.split("_")[0])#label = fname.split("_")[0]datas.append(data)labels.append(label)datas = np.array(datas)labels = np.array(labels)print("shape of datas: {}\tshape of labels: {}".format(datas.shape, labels.shape))return fpaths, datas, labelsfpaths, datas, labels = read_data(data_dir)# 计算有多少类图片
num_classes = len(set(labels))# 定义Placeholder,存放输入和标签
datas_placeholder = tf.placeholder(tf.float32, [None, 20, 20, 3])
labels_placeholder = tf.placeholder(tf.int32, [None])# 存放DropOut参数的容器,训练时为0.25,测试时为0
dropout_placeholdr = tf.placeholder(tf.float32)# 定义卷积层, 20个卷积核, 卷积核大小为5,用Relu激活
conv0 = tf.layers.conv2d(datas_placeholder, 20, 5, activation=tf.nn.relu)
# 定义max-pooling层,pooling窗口为2x2,步长为2x2
pool0 = tf.layers.max_pooling2d(conv0, [2, 2], [2, 2])# 定义卷积层, 40个卷积核, 卷积核大小为4,用Relu激活
conv1 = tf.layers.conv2d(pool0, 40, 4, activation=tf.nn.relu)
# 定义max-pooling层,pooling窗口为2x2,步长为2x2
pool1 = tf.layers.max_pooling2d(conv1, [2, 2], [2, 2])# 将3维特征转换为1维向量
flatten = tf.layers.flatten(pool1)# 全连接层,转换为长度为100的特征向量
fc = tf.layers.dense(flatten, 400, activation=tf.nn.relu)# 加上DropOut,防止过拟合
dropout_fc = tf.layers.dropout(fc, dropout_placeholdr)# 未激活的输出层
logits = tf.layers.dense(dropout_fc, num_classes)predicted_labels = tf.arg_max(logits, 1)# 利用交叉熵定义损失
losses = tf.nn.softmax_cross_entropy_with_logits(labels=tf.one_hot(labels_placeholder, num_classes),logits=logits
)
# 平均损失
mean_loss = tf.reduce_mean(losses)# 定义优化器,指定要优化的损失函数
optimizer = tf.train.AdamOptimizer(learning_rate=1e-2).minimize(losses)# 用于保存和载入模型
saver = tf.train.Saver()with tf.Session() as sess:if train:print("训练模式")# 如果是训练,初始化参数sess.run(tf.global_variables_initializer())# 定义输入和Label以填充容器,训练时dropout为0.25train_feed_dict = {datas_placeholder: datas,labels_placeholder: labels,dropout_placeholdr: 0.25}for step in range(300):#150_, mean_loss_val = sess.run([optimizer, mean_loss], feed_dict=train_feed_dict)if step % 10 == 0:print("step = {}\tmean loss = {}".format(step, mean_loss_val))saver.save(sess, model_path)print("训练结束,保存模型到{}".format(model_path))else:print("测试模式")# 如果是测试,载入参数saver.restore(sess, model_path)print("从{}载入模型".format(model_path))# label和名称的对照关系label_name_dict = {0: "0",1: "1",2: "2",3: "3",4: "4",5: "5",6: "6",7: "7",8: "8",9: "9",10: "A",11: "B",12: "C",13: "D",14: "E",15: "F",16: "G",17: "H",18: "I",19: "J",20: "K",21: "L",22: "M",23: "N",24: "P",25: "Q",26: "R",27: "S",28: "T",29: "U",30: "V",31: "W",32: "X",33: "Y",34: "Z"}# 定义输入和Label以填充容器,测试时dropout为0test_feed_dict = {datas_placeholder: datas,labels_placeholder: labels,dropout_placeholdr: 0}predicted_labels_val = sess.run(predicted_labels, feed_dict=test_feed_dict)len = predicted_labels_val.shape[0]num = 0# 真实label与模型预测labelfor fpath, real_label, predicted_label in zip(fpaths, labels, predicted_labels_val):# 将label id转换为label名real_label_name = label_name_dict[real_label]predicted_label_name = label_name_dict[predicted_label]print("{}\t{} => {}".format(fpath, real_label_name, predicted_label_name))if real_label == predicted_label:num = num + 1print("正确")else:print("错误***************************************************************************")print("正确率:{}% ,总个数:{},判断正确个数:{}".format(num / len * 100, len, num))

 

2019-06-26 15:58:18.709062: I tensorflow/core/common_runtime/process_util.cc:69] Creating new thread pool with default inter op setting: 4. Tune using inter_op_parallelism_threads for best performance.
测试模式
从model/image_model载入模型
test\0_1.jpg    0 => D
错误***************************************************************************
test\10_2.jpg    A => 1
错误***************************************************************************
test\11_0.jpg    B => B
正确
test\12_0.jpg    C => C
正确
test\13_0.jpg    D => D
正确
test\14_0.jpg    E => E
正确
test\15_0.jpg    F => E
错误***************************************************************************
test\16_0.jpg    G => G
正确
test\17_0.jpg    H => H
正确
test\18_0.jpg    I => I
正确
test\19_0.jpg    J => 2
错误***************************************************************************
test\1_0.jpg    1 => 1
正确
test\20_1.jpg    K => K
正确
test\21_0.jpg    L => L
正确
test\22_0.jpg    M => H
错误***************************************************************************
test\22_1.jpg    M => F
错误***************************************************************************
test\23_0.jpg    N => W
错误***************************************************************************
test\24_0.jpg    P => P
正确
test\25_0.jpg    Q => Q
正确
test\26_0.jpg    R => F
错误***************************************************************************
test\27_0.jpg    S => S
正确
test\28_0.jpg    T => T
正确
test\29_0.jpg    U => U
正确
test\2_1.jpg    2 => 2
正确
test\30_0.jpg    V => W
错误***************************************************************************
test\31_0.jpg    W => W
正确
test\32_0.jpg    X => X
正确
test\33_0.jpg    Y => Y
正确
test\34_0.jpg    Z => Z
正确
test\3_5.jpg    3 => 3
正确
test\4_0.jpg    4 => 4
正确
test\4_17.jpg    4 => 4
正确
test\5_2.jpg    5 => 5
正确
test\6_1.jpg    6 => 6
正确
test\7_1.jpg    7 => 7
正确
test\8_2.jpg    8 => 8
正确
test\8_4.jpg    8 => 8
正确
test\9_12.jpg    9 => 9
正确
正确率:76.31578947368422% ,总个数:38,判断正确个数:29

 

 

这篇关于字符是识别---11--源数据20*20--训练样本0~Z----基于TensorFlow+CNN实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1044591

相关文章

使用Python和OpenCV库实现实时颜色识别系统

《使用Python和OpenCV库实现实时颜色识别系统》:本文主要介绍使用Python和OpenCV库实现的实时颜色识别系统,这个系统能够通过摄像头捕捉视频流,并在视频中指定区域内识别主要颜色(红... 目录一、引言二、系统概述三、代码解析1. 导入库2. 颜色识别函数3. 主程序循环四、HSV色彩空间详解

PostgreSQL中MVCC 机制的实现

《PostgreSQL中MVCC机制的实现》本文主要介绍了PostgreSQL中MVCC机制的实现,通过多版本数据存储、快照隔离和事务ID管理实现高并发读写,具有一定的参考价值,感兴趣的可以了解一下... 目录一 MVCC 基本原理python1.1 MVCC 核心概念1.2 与传统锁机制对比二 Postg

SpringBoot整合Flowable实现工作流的详细流程

《SpringBoot整合Flowable实现工作流的详细流程》Flowable是一个使用Java编写的轻量级业务流程引擎,Flowable流程引擎可用于部署BPMN2.0流程定义,创建这些流程定义的... 目录1、流程引擎介绍2、创建项目3、画流程图4、开发接口4.1 Java 类梳理4.2 查看流程图4

SQL Server修改数据库名及物理数据文件名操作步骤

《SQLServer修改数据库名及物理数据文件名操作步骤》在SQLServer中重命名数据库是一个常见的操作,但需要确保用户具有足够的权限来执行此操作,:本文主要介绍SQLServer修改数据... 目录一、背景介绍二、操作步骤2.1 设置为单用户模式(断开连接)2.2 修改数据库名称2.3 查找逻辑文件名

C++中零拷贝的多种实现方式

《C++中零拷贝的多种实现方式》本文主要介绍了C++中零拷贝的实现示例,旨在在减少数据在内存中的不必要复制,从而提高程序性能、降低内存使用并减少CPU消耗,零拷贝技术通过多种方式实现,下面就来了解一下... 目录一、C++中零拷贝技术的核心概念二、std::string_view 简介三、std::stri

C++高效内存池实现减少动态分配开销的解决方案

《C++高效内存池实现减少动态分配开销的解决方案》C++动态内存分配存在系统调用开销、碎片化和锁竞争等性能问题,内存池通过预分配、分块管理和缓存复用解决这些问题,下面就来了解一下... 目录一、C++内存分配的性能挑战二、内存池技术的核心原理三、主流内存池实现:TCMalloc与Jemalloc1. TCM

OpenCV实现实时颜色检测的示例

《OpenCV实现实时颜色检测的示例》本文主要介绍了OpenCV实现实时颜色检测的示例,通过HSV色彩空间转换和色调范围判断实现红黄绿蓝颜色检测,包含视频捕捉、区域标记、颜色分析等功能,具有一定的参考... 目录一、引言二、系统概述三、代码解析1. 导入库2. 颜色识别函数3. 主程序循环四、HSV色彩空间

Python实现精准提取 PDF中的文本,表格与图片

《Python实现精准提取PDF中的文本,表格与图片》在实际的系统开发中,处理PDF文件不仅限于读取整页文本,还有提取文档中的表格数据,图片或特定区域的内容,下面我们来看看如何使用Python实... 目录安装 python 库提取 PDF 文本内容:获取整页文本与指定区域内容获取页面上的所有文本内容获取

基于Python实现一个Windows Tree命令工具

《基于Python实现一个WindowsTree命令工具》今天想要在Windows平台的CMD命令终端窗口中使用像Linux下的tree命令,打印一下目录结构层级树,然而还真有tree命令,但是发现... 目录引言实现代码使用说明可用选项示例用法功能特点添加到环境变量方法一:创建批处理文件并添加到PATH1

Java使用HttpClient实现图片下载与本地保存功能

《Java使用HttpClient实现图片下载与本地保存功能》在当今数字化时代,网络资源的获取与处理已成为软件开发中的常见需求,其中,图片作为网络上最常见的资源之一,其下载与保存功能在许多应用场景中都... 目录引言一、Apache HttpClient简介二、技术栈与环境准备三、实现图片下载与保存功能1.