基于Pytorch的验证码识别模型应用

2024-03-29 07:20

本文主要是介绍基于Pytorch的验证码识别模型应用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言

        在做OCR文字识别的时候,或多或少会接触一些验证码图片,这里收集了一些验证码图片,可以对验证码进行识别,可以识别4到6位,纯数字型、数字+字母型和纯字母型的一些验证码,准确率还是相当高,需要的可以下载使用。

准备工作 

1、Python环境,在Python官网下载安装

2、项目代码,下载地址在文章最后

代码量非常的少,可根据实际情况,通过fastapi、flask等web框架部署到服务器上。

 开始

以上准备工作完成后,就可以开始使用

1、下载依赖包
pip install pyaml
pip install torch
pip install opencv-python
2、编写预测代码,cpu中运行

这里传入的图片,可以是图片路径,也可以是通过cv2将图片转成mat后再传入。

import os
import sysfrom core.model import OCRRecognitionif __name__ == '__main__':ocr = OCRRecognition("./core/model/pytorch_model.pt","./core/model/vocab.txt",device="cpu")result = ocr("images/001.png")print(result)
3、gpu中运行

默认使用cpu运行,如果需要在gpu中运行,首先要配置GPU环境,可通过这篇文章进行配置【Ubuntu系统配置深度学习环境之nvidia显卡驱动和cuda安装】。

安装完成后,初始化方法改成:

    ocr = OCRRecognition("./core/model/pytorch_model.pt","./core/model/vocab.txt",device="gpu")
4、运行结果展示

输入图片:

实际运行效果还不错。

完毕!!!

模型及代码下载:基于Pytorch的验证码识别模型应用资源

这篇关于基于Pytorch的验证码识别模型应用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/857969

相关文章

全新突破:「Paraverse平行云」实现3D/XR企业级应用全面接入Apple Vision Pro

在前不久举行的GTC开发者大会上,英伟达引领行业风向,宣布其Omniverse平台能够助力企业将3D/XR应用流畅传输至Apple Vision Pro混合现实头显。在英伟达与苹果这两大科技巨头的合作下,此举标志着3D/XR技术迈向新纪元的关键一步。「Paraverse平行云」实时云渲染解决LarkXR解决方案,已同步实现企业级3D/XR应用全面接入Apple Vision Pro的创新方案。

pytorch对音频数据的读取和保存

torchaudio是PyTorch深度学习框架的一部分,主要用于处理和分析音频数据。它提供了丰富的音频信号处理工具、特征提取功能以及与深度学习模型结合的接口,使得在PyTorch中进行音频相关的机器学习和深度学习任务变得更加便捷。   通过使用torchaudio,开发者能够轻松地将音频数据转换为适合深度学习模型输入的形式,并利用PyTorch的高效张量运算和自动梯度功能进行训练和推理。此外

AutoCAD模型空间和图纸空间

我们知道,AutoCAD有二个作图空间,模型空间和图纸空间。顾名思义,模型空间就是指所画的实物,而图纸空间就相当于我们的图纸。这种说法只是帮助我们理解而已,严格一点是有破绽的。因为,一方面,我们不用图纸空间照样画图出图。事实上,R14以前,用图纸空间出图的案例相当少,我们都习惯在模型空间画图,然后设定打印比例缩小打印。另一方面,图纸空间也是作图空间,由图纸空间出图,理论上照样可以设定打印比例。

Matlab信号处理——基于BP神经网络的调制信号分类与识别

1. 信号生成 我们首先生成了包括8种调制方式的调制信号,具体为: clcclearfc=1000; %载波频率fs=5000; %采样速率t0=10; %信号长度fd=100; %符号速率ts=1/fs; %采样周期M=t0*fd; %码元个数ti=1/fd; %码元间隔N=ti/ts;t=0:ts:t0;titles = {'2ASK', '2FSK', '2PSK'

振弦采集仪在岩土工程监测中的应用案例与成果展示

振弦采集仪在岩土工程监测中的应用案例与成果展示 河北稳控科技振弦采集仪是一种岩土工程监测仪器,通过采集地下振动信号来获取地下构造的动态特性,具有高精度、高灵敏度和高实时性的特点。在岩土工程监测中,振弦采集仪广泛应用于地基沉降、地震波传播、地下水动力响应等方面,取得了一系列的应用案例与成果。 一,振弦采集仪在地基沉降监测中的应用案例。地基沉降是建筑物或其他结构在使用过程中由于地下土层的压缩和

【Unity动画系统】详解Root Motion动画在Unity中的应用(二)

Root Motion遇到Blend Tree  如果Root Motion动画片段的速度是1.8,那么阈值就要设置为1.8,那么在代码中的参数就可以直接反映出Root Motion的最终移动速度。 Compute Thresholds:根据Root Motion中某些数值自动计算这里的阈值。 Velocity X/Y/Z:代表在XYZ方向上的速度,注意Z方向的话,也就是前后的方

APP在应用市场上架时需要APP安全能力第三方评估报告怎么做

随着移动互联网的飞速发展,APP作为用户与互联网交互的重要工具,其安全性越来越受到人们的关注。为了确保用户在使用APP时的数据安全和隐私保护,应用市场上架前的APP安全能力第三方评估变得尤为重要。那么,如何进行这一评估并撰写评估报告呢? 一、明确评估目标和范围   首先,需要明确评估的目标和范围。评估目标通常包括APP的安全性、稳定性、兼容性等方面。范围则涉及APP的功能模块、用户数据保护、网络

面向工业过程的图像生成及其应用研究综述

源自:自动化学报 作者:汤健, 郭海涛, 夏恒, 王鼎, 乔俊飞 “人工智能技术与咨询”  发布 摘 要 在面向工业过程的计算机视觉研究中, 智能感知模型能否实际应用取决于其对复杂工业环境的适应能力. 由于可利用的工业图像数据集存在分布不均、多样性不足和干扰严重等问题, 如何生成符合多工况分布的期望训练集是提高感知模型性能的关键. 为解决上述问题, 以城市固废焚烧(Municipal so

Rust Web开发实战:打造高效稳定的服务端应用

Rust Web开发实战:打造高效稳定的服务端应用 本书将带领您从零开始构建Web应用程序,无论是API、微服务还是单体应用,都将一一涵盖。您将学到如何优雅地对外开放API,如何连接数据库以安全存储数据,以及如何对应用程序进行详尽的测试与部署。 本书不是一本简单的参考手册,而是一本实用的工作指南。书中构建的应用程序在设计上兼顾了教学与实践,旨在通过逐步深入的概念解释,助您快速上手。想要将应用程

商汤研究院招大模型实习生

商汤研究院招大模型实习生,base上海、北京,400/day。福利:每天50租房补贴,20的餐补。晚上8点之后回去有额外的25元晚餐餐补,10点之后回去可以免费用滴滴。 组内的大模型工作大概分两个方向: 1.3B、3B等小语言模型开发通用多模态基模型 最近商汤发布的多模态大模型就是我们组的工作: https://mp.weixin.qq.com/s/TlW26duB32QDwtZfvMatl