Tesseract3.04 和opencv3.1在条形码识别中的应用

2024-03-06 23:48

本文主要是介绍Tesseract3.04 和opencv3.1在条形码识别中的应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

 商品条码是由一组按一定规则排列的条、空及对应字符(阿拉伯数字)所组成,其中条为深色、空为纳色,用于条形码识别设备的扫描识读。其对应字符由一组阿拉伯数字组成,供人们直接识读或通过键盘向计算机输入数据使用。这一组条、空和相应的字符所表示的信息是相同的。本文提及的条形码识别程序BarcodeOCR用于识别条形码中阿拉伯数字。

       前言

       BarcodeOCR的原型来源于Github上的一个名为openCV_Tesseract_testrepository,感谢原作者的开源精神!  

       openCV_Tesseract_test主要展示的是摄像头取数据样本和测试样本,在该仓库中有一个视频链接用于展示该程序的效果,有兴趣的同学可以去围观一下。

       BarcodeOCR保留了openCV_Tesseract_test中摄像头取样本训练和识别的代码,新增了用本地已有图像训练样本和识别的选项,目前仅测试了新增部分。该工程基于VS2013+opencv3.1+Tesseract3.04,关于opencv和Tesseract的设置和使用方案请在本博客内搜索相应关键词,博客内均有详细讲解。

       BarcodeOCR中包含两类条形码,其识别结果分别如下图:

Barcode test result1


Barcode test result2

       BarcodeOCR工作原理概述

       BarcodeOCR工作原理部分可配合该工程的源代码一起查阅,源代码地址:https://github.com/livezingy/BarcodeOCR

       1. BarcodeOCR启动界面如下图所示,需要用户选择opencv SVM所使用的特征。

Barcode Interface

       openCV_Tesseract_test训练SVM时,输入的是图像的全部特征。在BarcodeOCR中,我添加了LBP特征,不过训练样本openCV_Tesseract_test中的400个样本,其中包含200个非条码样本,100个1类条码样本,100个2类条码样本。在BarcodeOCR中,我将各类样本一分为二,一半用于做训练样本,另一半用于测试。

       下图为训练结果对比,貌似全部特征的训练结果略优于LBP特征。       

training result

       2. 选定特征后,BarcodeOCR会在BarcodeOCR.vcxproj同路径下查找是否已有选定特征已训练好的xml文件,若有,则直接加载该文件使用;若没有,则会在控制台提示选择训练样本来源,可选择用指定路径下的文件夹样本进行训练,也可以选择用摄像头来获取训练样本(目前暂未测试)。

       3. 待SVM文件加载完成或训练完成后,控制台会提示选择测试文件来源,两个选项:选择指定路径下的测试样本,或者选择直接用摄像头验证。(暂未测试)

       4. 目前选择指定路径下的测试样本时,那么BarcodeOCR会统一对该路径下的所有样本进行预判断,然后用openCV对判断为条形码的样本进行预处理,预处理完成后用Tesseract进行识别。若需要测试单张图像,那么请在指定路径下放置一张待测样本。测试结果会有窗口显示,同时在BarcodeOCR.vcxproj路径下会有一个result.txt文件,记录该路径下所有预测为条形码样本的识别结果。

这篇关于Tesseract3.04 和opencv3.1在条形码识别中的应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/781759

相关文章

Spring Boot Actuator应用监控与管理的详细步骤

《SpringBootActuator应用监控与管理的详细步骤》SpringBootActuator是SpringBoot的监控工具,提供健康检查、性能指标、日志管理等核心功能,支持自定义和扩展端... 目录一、 Spring Boot Actuator 概述二、 集成 Spring Boot Actuat

PyTorch中的词嵌入层(nn.Embedding)详解与实战应用示例

《PyTorch中的词嵌入层(nn.Embedding)详解与实战应用示例》词嵌入解决NLP维度灾难,捕捉语义关系,PyTorch的nn.Embedding模块提供灵活实现,支持参数配置、预训练及变长... 目录一、词嵌入(Word Embedding)简介为什么需要词嵌入?二、PyTorch中的nn.Em

Spring Boot3.0新特性全面解析与应用实战

《SpringBoot3.0新特性全面解析与应用实战》SpringBoot3.0作为Spring生态系统的一个重要里程碑,带来了众多令人兴奋的新特性和改进,本文将深入解析SpringBoot3.0的... 目录核心变化概览Java版本要求提升迁移至Jakarta EE重要新特性详解1. Native Ima

Redis中Stream详解及应用小结

《Redis中Stream详解及应用小结》RedisStreams是Redis5.0引入的新功能,提供了一种类似于传统消息队列的机制,但具有更高的灵活性和可扩展性,本文给大家介绍Redis中Strea... 目录1. Redis Stream 概述2. Redis Stream 的基本操作2.1. XADD

JSONArray在Java中的应用操作实例

《JSONArray在Java中的应用操作实例》JSONArray是org.json库用于处理JSON数组的类,可将Java对象(Map/List)转换为JSON格式,提供增删改查等操作,适用于前后端... 目录1. jsONArray定义与功能1.1 JSONArray概念阐释1.1.1 什么是JSONA

nginx -t、nginx -s stop 和 nginx -s reload 命令的详细解析(结合应用场景)

《nginx-t、nginx-sstop和nginx-sreload命令的详细解析(结合应用场景)》本文解析Nginx的-t、-sstop、-sreload命令,分别用于配置语法检... 以下是关于 nginx -t、nginx -s stop 和 nginx -s reload 命令的详细解析,结合实际应

PostgreSQL的扩展dict_int应用案例解析

《PostgreSQL的扩展dict_int应用案例解析》dict_int扩展为PostgreSQL提供了专业的整数文本处理能力,特别适合需要精确处理数字内容的搜索场景,本文给大家介绍PostgreS... 目录PostgreSQL的扩展dict_int一、扩展概述二、核心功能三、安装与启用四、字典配置方法

Python中re模块结合正则表达式的实际应用案例

《Python中re模块结合正则表达式的实际应用案例》Python中的re模块是用于处理正则表达式的强大工具,正则表达式是一种用来匹配字符串的模式,它可以在文本中搜索和匹配特定的字符串模式,这篇文章主... 目录前言re模块常用函数一、查看文本中是否包含 A 或 B 字符串二、替换多个关键词为统一格式三、提

Java MQTT实战应用

《JavaMQTT实战应用》本文详解MQTT协议,涵盖其发布/订阅机制、低功耗高效特性、三种服务质量等级(QoS0/1/2),以及客户端、代理、主题的核心概念,最后提供Linux部署教程、Sprin... 目录一、MQTT协议二、MQTT优点三、三种服务质量等级四、客户端、代理、主题1. 客户端(Clien

Python中图片与PDF识别文本(OCR)的全面指南

《Python中图片与PDF识别文本(OCR)的全面指南》在数据爆炸时代,80%的企业数据以非结构化形式存在,其中PDF和图像是最主要的载体,本文将深入探索Python中OCR技术如何将这些数字纸张转... 目录一、OCR技术核心原理二、python图像识别四大工具库1. Pytesseract - 经典O