对公转账上传凭证OCR测试

2023-10-30 02:10

本文主要是介绍对公转账上传凭证OCR测试,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、什么是OCR

OCR(Optical Character Recognition光学字符识别)是指通过对图像的分析处理将图像中的文字信息识别、提取并转化为计算机文字,简单来说是识别图片中的字符转化为可编辑文档。例如识别书籍扫描照片中的文字、识别身份证照片中的关键信息、识别银行卡照片中的银行卡号等。

  • OCR的一般过程为图像预处理特征提取文字区域检测文本识别与输出

  • OCR技术从文字类型的角度可分为印刷文字识别手写文字识别,从识别目的的角度可分为通用OCR专用OCR

  • 通用OCR是指对图片中所有文字和字符进行识别,并可返回文字对应位置信息。

  • 专用OCR是指对图片中的特定位置、特定信息进行识别提取,通常是针对票据、证件、牌照等制式票证图片。

二、什么是OCR测试

OCR模型是OCR功能的核心,经过大量图片及标注数据学习训练而成,在此基础上封装为OCR服务对外提供服务,通常以联机接口形式实现供其他系统调用。

OCR测试可分为两部分,一是对OCR模型识别的效果进行测试,判断其是否满足业务应用场景的要求,二是对OCR服务进行测试,包括功能测试性能测试以及安全测试等。

三、OCR测试案例分享

做B2B电商项目时涉及到对公转账,买家需上传支付凭证(银行转账电子回单)。未实现OCR功能前,买家不仅需要手动填写转账的相关信息还需上传凭证,操作起来容易出错且效率低,为了提质增效客户提出了增加OCR识别票据的需求,基于此测试人员需要测试该功能。

3.1 OCR测试步骤

  1. 收集大量支付凭证的样本。可以从现有的数据集中获取,也可以自己制作。要尽可能涵盖不同类型和格式的支付凭证,以提高OCR的鲁棒性。

  1. 选择OCR技术和工具。OCR技术包括传统的基于规则和模板的方法,以及基于深度学习的方法。你可以根据需求选择适合的技术和工具。常用的OCR工具包括Tesseract、OCRopus、Adobe Acrobat、ABBYY FineReader等。

  1. 对样本进行预处理。由于支付凭证的图片质量可能不一,需要进行预处理,例如去除噪声、调整亮度和对比度、裁剪、旋转等。

  1. 进行OCR测试。将样本图片输入到OCR工具中,让工具自动识别文本信息。可以通过手动校对OCR结果的方式来评估OCR的准确率。

  1. 优化OCR结果。根据测试结果,分析OCR错误的原因,进一步优化OCR模型和参数,以提高准确率。

需要注意的是,OCR技术虽然可以提高处理效率,但并不是100%准确,可能会出现识别错误的情况。因此,在使用OCR技术处理重要数据时,一定要进行人工审核和确认,确保数据的准确性。

3.2 OCR测试方案

支付凭证OCR功能测试的目标是确保OCR系统可以准确地识别支付凭证中的信息,包括付款人、收款人、付款金额等,并将识别结果转换为可编辑的文本格式。以下是一些可以考虑的测试方案:

  1. OCR准确性测试:收集包含不同类型和格式的支付凭证图片样本,例如PDF、JPG、PNG等,分别进行OCR测试,并将OCR结果与手动输入的正确数据进行比较,验证OCR识别准确率是否达到预期要求。

  1. 数据格式测试:测试系统是否能够正确地将识别结果转换为可编辑的文本格式,例如txt、doc等。

  1. 图像质量测试:测试系统是否能够正确地处理各种图像质量的支付凭证图片,包括模糊、倾斜、噪声等。

  1. 多语言支持测试:测试系统是否能够正确地识别不同语言的支付凭证信息,例如中文、英文、日文等。

  1. 性能测试:测试系统处理多个支付凭证的性能,包括处理时间、系统稳定性等。

  1. 异常处理测试:测试系统是否能够正确地处理各种异常情况,例如无法识别的字符、缺失信息、重复信息等。

测试完成后,需要对测试结果进行分析,确定系统的准确性、稳定性和性能是否符合预期要求,并及时修复和优化系统中存在的问题。同时,还需要对测试过程中发现的问题进行记录和归档,以便后续追溯和改进。

这篇关于对公转账上传凭证OCR测试的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/304906

相关文章

SpringBoot实现不同接口指定上传文件大小的具体步骤

《SpringBoot实现不同接口指定上传文件大小的具体步骤》:本文主要介绍在SpringBoot中通过自定义注解、AOP拦截和配置文件实现不同接口上传文件大小限制的方法,强调需设置全局阈值远大于... 目录一  springboot实现不同接口指定文件大小1.1 思路说明1.2 工程启动说明二 具体实施2

基于Python Playwright进行前端性能测试的脚本实现

《基于PythonPlaywright进行前端性能测试的脚本实现》在当今Web应用开发中,性能优化是提升用户体验的关键因素之一,本文将介绍如何使用Playwright构建一个自动化性能测试工具,希望... 目录引言工具概述整体架构核心实现解析1. 浏览器初始化2. 性能数据收集3. 资源分析4. 关键性能指

Spring Boot 结合 WxJava 实现文章上传微信公众号草稿箱与群发

《SpringBoot结合WxJava实现文章上传微信公众号草稿箱与群发》本文将详细介绍如何使用SpringBoot框架结合WxJava开发工具包,实现文章上传到微信公众号草稿箱以及群发功能,... 目录一、项目环境准备1.1 开发环境1.2 微信公众号准备二、Spring Boot 项目搭建2.1 创建

使用Python进行GRPC和Dubbo协议的高级测试

《使用Python进行GRPC和Dubbo协议的高级测试》GRPC(GoogleRemoteProcedureCall)是一种高性能、开源的远程过程调用(RPC)框架,Dubbo是一种高性能的分布式服... 目录01 GRPC测试安装gRPC编写.proto文件实现服务02 Dubbo测试1. 安装Dubb

Python的端到端测试框架SeleniumBase使用解读

《Python的端到端测试框架SeleniumBase使用解读》:本文主要介绍Python的端到端测试框架SeleniumBase使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全... 目录SeleniumBase详细介绍及用法指南什么是 SeleniumBase?SeleniumBase

Python中图片与PDF识别文本(OCR)的全面指南

《Python中图片与PDF识别文本(OCR)的全面指南》在数据爆炸时代,80%的企业数据以非结构化形式存在,其中PDF和图像是最主要的载体,本文将深入探索Python中OCR技术如何将这些数字纸张转... 目录一、OCR技术核心原理二、python图像识别四大工具库1. Pytesseract - 经典O

Python基于微信OCR引擎实现高效图片文字识别

《Python基于微信OCR引擎实现高效图片文字识别》这篇文章主要为大家详细介绍了一款基于微信OCR引擎的图片文字识别桌面应用开发全过程,可以实现从图片拖拽识别到文字提取,感兴趣的小伙伴可以跟随小编一... 目录一、项目概述1.1 开发背景1.2 技术选型1.3 核心优势二、功能详解2.1 核心功能模块2.

python多线程并发测试过程

《python多线程并发测试过程》:本文主要介绍python多线程并发测试过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录一、并发与并行?二、同步与异步的概念?三、线程与进程的区别?需求1:多线程执行不同任务需求2:多线程执行相同任务总结一、并发与并行?1、

GitLab文件的上传与下载方式

《GitLab文件的上传与下载方式》:本文主要介绍GitLab文件的上传与下载方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录GitLab 项目拉取到本地GitLab 项目上传方法方法 1:本地项目未初始化Git方法 2:本地项目已初始化GitGitLab 上

Nginx 413修改上传文件大小限制的方法详解

《Nginx413修改上传文件大小限制的方法详解》在使用Nginx作为Web服务器时,有时会遇到客户端尝试上传大文件时返回​​413RequestEntityTooLarge​​... 目录1. 理解 ​​413 Request Entity Too Large​​ 错误2. 修改 Nginx 配置2.1