tesseract-ocr一站式安装与使用

2024-04-06 03:12

本文主要是介绍tesseract-ocr一站式安装与使用,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目录

前言

安装tesseract-ocr

添加环境变量

1、在path中添加

2、在系統變量中添加

3、验证是否添加成功

添加语言包

更多语言包下载

示例程序


前言

如果你遇到了:make sure the TESSDATA_PREFIX Failed loading language \‘chi_sim

那么就是语言包缺少这个!chi_sim!!!请看下面内容

首先,你得找一篇文章了解tesseract-ocr

Tesseract-OCR 是一个开源的光学字符识别引擎,可以用于从图像中提取文本信息。它最初由惠普实验室开发,后来被谷歌收购并开源。Tesseract 可以识别多种语言,并且在处理复杂的文档布局时表现良好。

Tesseract 使用的是深度学习和模式识别算法来识别图像中的字符,并将其转换成计算机可处理的文本数据。它支持多种操作系统,包括 Windows、Linux 和 macOS,并提供了多种编程语言的接口,比如 Python、Java 和 C++,使得开发者可以方便地集成到各种应用程序中进行文字识别。

Tesseract-OCR 被广泛应用于文档处理、图像识别、自动化办公、数字化档案等领域,为用户提供了快速、准确地从图像中提取文本的能力。

今天给同学跑项目,他的项目用到了tesseract-ocr

结果搞半天,百度出来的CSDN链接,下载那些包,还全部要钱,大无语...

总结:

1、直接开着梯子去GitHub下载最新版的【tesseract-ocr】
2、然后直接选择需要识别的语言类型(一般我们需要识别中文的,就选择一下中文就行了)


安装包+中文识别语言包,我都放在蓝奏云了,可以直接安装,然后跑demo

跟着下面教程内容走就行了

最后就可以直接跑demo了!

安装tesseract-ocr

Releases · UB-Mannheim/tesseract (github.com) 直接进去下载最新版即可

安装包——蓝奏云备份:

tesseract-ocr-w64-setup-5.3.3.20231005.zip - 蓝奏云文件大小:47.8 M|icon-default.png?t=N7T8https://wwm.lanzout.com/i8bPj1tzz21e

接下来一路ok就行了——就只有在语言下载那里,需要开梯子

需要开梯子

需要开梯子

需要开梯子

不然会下载语言包失败!!!

不然会下载语言包失败!!!

不然会下载语言包失败!!!

注意这里!!!

注意这里!!!

注意这里!!!

自己记着安装路径——以后要加环境变量

自己记着安装路径——以后要加环境变量

自己记着安装路径——以后要加环境变量

添加环境变量

1、在path中添加

 tesseract-ocr ——【找到自己的安装路径】

我的:D:\Tesseract-OCR

2、在系統變量中添加

变量名:TESSDATA_PREFIX

变量值:D:\Tesseract-OCR\tessdata

3、验证是否添加成功

打开cmd ->输入命令

tesseract -v

添加语言包

语言包下载

如果你没有梯子,在这里下载失败了,就可以单独下载语言包

如果你没有梯子,在这里下载失败了,就可以单独下载语言包

如果你没有梯子,在这里下载失败了,就可以单独下载语言包

蓝奏云备份(这里是中文语言包):

tessdata语言包-中文+英文.zip - 蓝奏云文件大小:7.4 M|icon-default.png?t=N7T8https://wwm.lanzout.com/iT9K41u00y2d把语言包——放在这里面就行了!!!

把语言包——放在这里面就行了!!!

把语言包——放在这里面就行了!!!

更多语言包下载

GitCode - 开发者的代码家园icon-default.png?t=N7T8https://gitcode.com/tesseract-ocr/tessdata/tree/main

示例程序

pip install Pillow pytesseract
from PIL import Image
import pytesseract# 使用 pytesseract 进行文字识别,lang 参数指定识别语言为简体中文
text = pytesseract.image_to_string(Image.open(r'D:\333.png'),lang='chi_sim')
print(text)

其他

from PIL import Image
import pytesseract# 设置 Tesseract 路径(根据你的安装路径修改)
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files (x86)\Tesseract-OCR\tesseract.exe"# 打开图像文件
image_path = r'D:\333.png'
image = Image.open(image_path)# 使用 pytesseract 进行文字识别,lang 参数指定识别语言为简体中文
text = pytesseract.image_to_string(image, lang='chi_sim')# 打印识别结果
print(text)

这篇关于tesseract-ocr一站式安装与使用的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/878859

相关文章

windows系统上如何进行maven安装和配置方式

《windows系统上如何进行maven安装和配置方式》:本文主要介绍windows系统上如何进行maven安装和配置方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不... 目录1. Maven 简介2. maven的下载与安装2.1 下载 Maven2.2 Maven安装2.

Redis指南及6.2.x版本安装过程

《Redis指南及6.2.x版本安装过程》Redis是完全开源免费的,遵守BSD协议,是一个高性能(NOSQL)的key-value数据库,Redis是一个开源的使用ANSIC语言编写、支持网络、... 目录概述Redis特点Redis应用场景缓存缓存分布式会话分布式锁社交网络最新列表Redis各版本介绍旧

MySQL的ALTER TABLE命令的使用解读

《MySQL的ALTERTABLE命令的使用解读》:本文主要介绍MySQL的ALTERTABLE命令的使用,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1、查看所建表的编China编程码格式2、修改表的编码格式3、修改列队数据类型4、添加列5、修改列的位置5.1、把列

Python使用FFmpeg实现高效音频格式转换工具

《Python使用FFmpeg实现高效音频格式转换工具》在数字音频处理领域,音频格式转换是一项基础但至关重要的功能,本文主要为大家介绍了Python如何使用FFmpeg实现强大功能的图形化音频转换工具... 目录概述功能详解软件效果展示主界面布局转换过程截图完成提示开发步骤详解1. 环境准备2. 项目功能结

SpringBoot使用ffmpeg实现视频压缩

《SpringBoot使用ffmpeg实现视频压缩》FFmpeg是一个开源的跨平台多媒体处理工具集,用于录制,转换,编辑和流式传输音频和视频,本文将使用ffmpeg实现视频压缩功能,有需要的可以参考... 目录核心功能1.格式转换2.编解码3.音视频处理4.流媒体支持5.滤镜(Filter)安装配置linu

Redis中的Lettuce使用详解

《Redis中的Lettuce使用详解》Lettuce是一个高级的、线程安全的Redis客户端,用于与Redis数据库交互,Lettuce是一个功能强大、使用方便的Redis客户端,适用于各种规模的J... 目录简介特点连接池连接池特点连接池管理连接池优势连接池配置参数监控常用监控工具通过JMX监控通过Pr

apache的commons-pool2原理与使用实践记录

《apache的commons-pool2原理与使用实践记录》ApacheCommonsPool2是一个高效的对象池化框架,通过复用昂贵资源(如数据库连接、线程、网络连接)优化系统性能,这篇文章主... 目录一、核心原理与组件二、使用步骤详解(以数据库连接池为例)三、高级配置与优化四、典型应用场景五、注意事

Linux下安装Anaconda3全过程

《Linux下安装Anaconda3全过程》:本文主要介绍Linux下安装Anaconda3全过程,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录简介环境下载安装一、找到下载好的文件名为Anaconda3-2018.12-linux-x86_64的安装包二、或者通

MySQL 安装配置超完整教程

《MySQL安装配置超完整教程》MySQL是一款广泛使用的开源关系型数据库管理系统(RDBMS),由瑞典MySQLAB公司开发,目前属于Oracle公司旗下产品,:本文主要介绍MySQL安装配置... 目录一、mysql 简介二、下载 MySQL三、安装 MySQL四、配置环境变量五、配置 MySQL5.1

使用Python实现Windows系统垃圾清理

《使用Python实现Windows系统垃圾清理》Windows自带的磁盘清理工具功能有限,无法深度清理各类垃圾文件,所以本文为大家介绍了如何使用Python+PyQt5开发一个Windows系统垃圾... 目录一、开发背景与工具概述1.1 为什么需要专业清理工具1.2 工具设计理念二、工具核心功能解析2.