windows系统搭建OCR半自动标注工具PaddleOCR

2024-04-09 18:44

本文主要是介绍windows系统搭建OCR半自动标注工具PaddleOCR,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

深度学习


文章目录

  • 深度学习
  • 前言
  • 一、环境搭建准备
    • 方式1:安装Anaconda搭建
      • 1. Anaconda下载地址: [点击](https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=D)
      • 2. 创建新的conda环境
    • 方式2. 直接安装python
  • 二、安装CPU版本
    • 1. 安装PaddlePaddle
    • 2、安装PaddleOCR whl包
      • 提示:
    • 验证安装
    • 如何卸载
  • 三、安装和运行标注工具PPOCRLabel
    • 1. 获取源代码
    • 2. 安装运行
    • 3. 使用PPOCRLabel
  • 问题汇总


前言

PaddleOCR是一个基于飞桨开发的OCR(Optical Character Recognition,光学字符识别)系统。其技术体系包括文字检测、文字识别、文本方向检测和图像处理等模块。

一、环境搭建准备

Windows和Mac用户推荐使用Anaconda搭建Python环境,Linux用户建议使用docker搭建Python环境。
已搭建过查看环境:
确认python的版本是否满足要求:python --version
确认 pip 的版本是否满足要求:python -m ensurepip
同时查看:python -m pip --version
注:pip 版本为 20.2.2 或更高版本

方式1:安装Anaconda搭建

python集成环境Anaconda工具包,安装完Anaconda后,可以安装python环境,以及numpy等所需的工具包环境

1. Anaconda下载地址: 点击

默认安装位置为C盘,建议将安装位置更改到D盘,勾选conda加入环境变量,忽略警告,
安装完成后,打开终端并创建conda环境:左下角Windows Start Menu -> Anaconda3 -> Anaconda Prompt启动控制台:

2. 创建新的conda环境

在命令行输入以下命令(此处为加速下载,使用清华源)

conda create --name paddle_env python=3.10 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/

该命令会创建1个名为paddle_env、python版本为3.10的可执行环境,根据网络状态,需要花费一段时间。

方式2. 直接安装python

python下载地址:https://www.python.org/downloads/

点击Download后进入版本界面,根据系统选择合适的版本,

windows installer:exe可执行文件,安装比较方便。(windows下可执行文件一般是exe,msi等);

windows embeddable package:

注:安装Python尽量选择最新版本的上一版本,本人使用最新版各种出错,无奈卸载重新下载另一版本才成功。

安装Python时记得勾选Add Python To Path。

安装完成进入Windows终端测试Python是否安装成功:若出现"不是内部或外部命令,也不是可运行的程序", 请及时检查环境变量中是否存在 python安装的路径。
手动添加环境变量:右键【此电脑】属性–高级系统设置----高级–环境变量

二、安装CPU版本

1. 安装PaddlePaddle

执行以下命令(速度快):

python -m pip install paddlepaddle==2.6.0 -i https://pypi.tuna.tsinghua.edu.cn/simple

或者

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple some-package

速度慢:

python3 -m pip install paddlepaddle==2.6.0 -i https://mirror.baidu.com/pypi/simple

如果提示升级pip,执行以下命令(三选一):

python -m pip install --upgrade pip
pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
python -m pip install -i https://pypi.tuna.tsinghua.edu.cn/simple --upgrade pip

注:请确认需要安装 PaddlePaddle 的 Python 是您预期的位置,因为您计算机可能有多个 Python。根据您的环境您可能需要将说明中所有命令行中的 python 替换为具体的 Python 路径。

2、安装PaddleOCR whl包

执行以下命令:推荐使用2.6.0以上版本(最新版是2.7,所以我写的是大于版本2.6.0)

pip install "paddleocr>=2.6.0"

对于Windows环境用户:直接通过pip安装的shapely库可能出现“找不到指定模块”的问题。建议下载shapely安装包完成安装。
1.下载安装whl以及确定Python适配版本(请自行搜索)
2.将 wheel 包下载到本地:

python -m pip download paddlepaddle==2.6.0 -f https://www.paddlepaddle.org.cn/whl/windows/openblas/avx/stable.html --no-index --no-deps

3.再本地安装:

python -m pip install [name].whl    #([name]为 wheel 包名称)

提示:

如果同时使用whl包安装了paddleocr,其优先级大于通过paddleocr.py调用PaddleOCR类,whl包未更新时会导致程序异常。
如果出现 module ‘cv2’ has no attribute 'INTER_NEAREST’错误,需要首先删除所有opencv相关包,然后重新安装4.2.0.32版本的headless opencv:pip install opencv-contrib-python-headless==4.2.0.32。

验证安装

需要先在终端里打开python,在Python在运行

import paddle
paddle.utils.run_check()

如果出现PaddlePaddle is installed successfully!,即成功。
注:需要先在终端里运行python,然后再输入运行。

如何卸载

python -m pip uninstall paddlepaddle

三、安装和运行标注工具PPOCRLabel

1. 获取源代码

PaddleOCR2.7版本:https://github.com/PaddlePaddle/PaddleOCR
在PaddleOCR2.7文件夹下打开终端运行:

pip3 install -r requirements.txt    #安装第三方依赖库

2. 安装运行

(1) 方法1:终端运行(通过whl包安装与运行)

pip install PPOCRLabel # 安装

在PaddleOCR2.7文件夹下打开终端运行

PPOCRLabel --lang ch # 启动【普通模式】,用于打【检测+识别】场景的标签
PPOCRLabel --lang ch --kie True # 启动 【KIE 模式】,用于打【检测+识别+关键字提取】场景的标签。

注:如若出现了类似反馈, ppocr WARNING: When args.layout is false, args.ocr is automatically set to false,可以忽略,能正常使用。

此后会弹出PPOCRLabel窗口。

注:通过whl包安装PPOCRLabel会自动下载paddleocr whl包,其中shapely依赖可能会出现找不到指定模块的问题。建议从https://www.lfd.uci.edu/~gohlke/pythonlibs/#shapely下载shapely安装包完成安装。

3. 使用PPOCRLabel

1、打开文件夹:在菜单栏点击 “文件”–"打开目录"选择待标记图片的文件夹。只能选择文件夹,不能选择单个文件。
2、自动标注:点击“自动标注”,使用PP-OCR超轻量模型对图片文件名前图片状态为“X” 的图片进行自动标注。
3、手动标注:点击“矩形标注”(推荐直接在英文模式下点击键盘中的“W”),用户可对当前图片中模型未检出的部分进行手动绘制标记框。点击键盘Q,则使用多点标注模式,用户依次点击4个点后,双击左键表示标注完成。
4、注:在使用矩形标注时如果经常性闪退,建议使用多点标注,结合实际更换方法。
标记框绘制完成后,用户点击“确认”,检测框会先被预分配一个“待识别”标签,可以在框选的文字右键–重识别此区块。“待识别”内容就会更新。
5、重新识别:将图片中的所有检测画绘制/调整完成后,点击“重新识别”,PP-OCR模型会对当前图片中的所有检测框重新识别。
6、内容更改:单击识别结果,对不准确的识别结果进行手动更改。
7、确认标记:点击 “确认”,图片状态切换为“√,跳转至下一张。
8、删除:点击“删除图像”,图片将会被删除至回收站。
9、导出结果:用户可以通过菜单中“文件-导出标记结果”手动导出,同时也可以点击“文件-自动导出标记结果”开启自动导出。自动导出:点击“文件 - 自动导出标记结果”后,用户每确认过一张图片,程序自动将标记结果写入Label.txt中。若未开启此选项,则检测到用户手动确认过5张图片后进行自动导出。默认情况下自动导出功能为关闭状态。
10、手动确认过的标记将会被存放在所打开图片文件夹下的Label.txt中。在菜单栏点击 “文件”–"导出识别结果"后,会将此类图片的识别训练数据保存在crop_img文件夹下,识别标签保存在rec_gt.txt中。

Label.txt:检测标签,可直接用于PPOCR检测模型训练。用户每确认5张检测结果后,程序会进行自动写入。当用户关闭应用程序或切换文件路径后同样会进行写入。
fileState.txt:图片状态标记文件,保存当前文件夹下已经被用户手动确认过的图片名称。
Cache.cach:缓存文件,保存模型自动识别的结果。
rec_gt.txt:识别标签。可直接用于PPOCR识别模型训练。需用户手动点击菜单栏文件–导出识别结果后产生。
crop_img:识别数据。按照检测框切割后的图片。与rec_gt.txt同时产生。

注:PPOCRLabel不支持对纯中文文件名的图片进行自动标注。

提示:修改识别结果时,文字如果出现突然不能输入中文,或者输入法不出现等,建议先对已标注进行保存,然后重置界面与保存地址,退出程序,再次运行即可正常(内容少的临时解决方法:复制粘贴文字进行修改)。

问题汇总

如果标注时打框就闪退,
修改以下文件
1、D:\Python310\Lib\site-packages\PPOCRLabel\libs\canvas.py(根据自己的Python安装位置找)中

p.drawRect(leftTop.x(), leftTop.y(), rectWidth, rectHeight
改为
p.drawRect(int(leftTop.x()), int(leftTop.y()), int(rectWidth), int(rectHeight))p.drawLine(self.prevPoint.x(), 0, self.prevPoint.x(), self.pixmap.height())
改为
p.drawLine(int(self.prevPoint.x()), 0, int(self.prevPoint.x()), self.pixmap.height())p.drawLine(0, self.prevPoint.y(), self.pixmap.width(), self.prevPoint.y())
改为
p.drawLine(0, int(self.prevPoint.y()), self.pixmap.width(), int(self.prevPoint.y()))

2、D:\Python310\Lib\site-packages\PPOCRLabel\PPOCRLabel.py 中

bar.setValue(bar.value() + bar.singleStep() * units)
改为
bar.setValue(int(bar.value() + bar.singleStep() * units))

建议:如果下载验证中途出现各种问题建议彻底删除相关所有软件再重新安装,本人使用中因为版本及软件卸载遗留的问题等出现了多种莫名的问题,无奈选择彻底卸载重装重来一遍就OK了!!
3、启动报错
添加环境变量
os.environ[“KMP_DUPLICATE_LIB_OK”]=“TRUE”`

这篇关于windows系统搭建OCR半自动标注工具PaddleOCR的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/888929

相关文章

SQLite3命令行工具最佳实践指南

《SQLite3命令行工具最佳实践指南》SQLite3是轻量级嵌入式数据库,无需服务器支持,具备ACID事务与跨平台特性,适用于小型项目和学习,sqlite3.exe作为命令行工具,支持SQL执行、数... 目录1. SQLite3简介和特点2. sqlite3.exe使用概述2.1 sqlite3.exe

Windows下C++使用SQLitede的操作过程

《Windows下C++使用SQLitede的操作过程》本文介绍了Windows下C++使用SQLite的安装配置、CppSQLite库封装优势、核心功能(如数据库连接、事务管理)、跨平台支持及性能优... 目录Windows下C++使用SQLite1、安装2、代码示例CppSQLite:C++轻松操作SQ

一文详解如何在idea中快速搭建一个Spring Boot项目

《一文详解如何在idea中快速搭建一个SpringBoot项目》IntelliJIDEA作为Java开发者的‌首选IDE‌,深度集成SpringBoot支持,可一键生成项目骨架、智能配置依赖,这篇文... 目录前言1、创建项目名称2、勾选需要的依赖3、在setting中检查maven4、编写数据源5、开启热

基于Python实现一个Windows Tree命令工具

《基于Python实现一个WindowsTree命令工具》今天想要在Windows平台的CMD命令终端窗口中使用像Linux下的tree命令,打印一下目录结构层级树,然而还真有tree命令,但是发现... 目录引言实现代码使用说明可用选项示例用法功能特点添加到环境变量方法一:创建批处理文件并添加到PATH1

使用jenv工具管理多个JDK版本的方法步骤

《使用jenv工具管理多个JDK版本的方法步骤》jenv是一个开源的Java环境管理工具,旨在帮助开发者在同一台机器上轻松管理和切换多个Java版本,:本文主要介绍使用jenv工具管理多个JD... 目录一、jenv到底是干啥的?二、jenv的核心功能(一)管理多个Java版本(二)支持插件扩展(三)环境隔

Windows的CMD窗口如何查看并杀死nginx进程

《Windows的CMD窗口如何查看并杀死nginx进程》:本文主要介绍Windows的CMD窗口如何查看并杀死nginx进程问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地... 目录Windows的CMD窗口查看并杀死nginx进程开启nginx查看nginx进程停止nginx服务

Python基于微信OCR引擎实现高效图片文字识别

《Python基于微信OCR引擎实现高效图片文字识别》这篇文章主要为大家详细介绍了一款基于微信OCR引擎的图片文字识别桌面应用开发全过程,可以实现从图片拖拽识别到文字提取,感兴趣的小伙伴可以跟随小编一... 目录一、项目概述1.1 开发背景1.2 技术选型1.3 核心优势二、功能详解2.1 核心功能模块2.

基于Python实现一个简单的题库与在线考试系统

《基于Python实现一个简单的题库与在线考试系统》在当今信息化教育时代,在线学习与考试系统已成为教育技术领域的重要组成部分,本文就来介绍一下如何使用Python和PyQt5框架开发一个名为白泽题库系... 目录概述功能特点界面展示系统架构设计类结构图Excel题库填写格式模板题库题目填写格式表核心数据结构

Python使用smtplib库开发一个邮件自动发送工具

《Python使用smtplib库开发一个邮件自动发送工具》在现代软件开发中,自动化邮件发送是一个非常实用的功能,无论是系统通知、营销邮件、还是日常工作报告,Python的smtplib库都能帮助我们... 目录代码实现与知识点解析1. 导入必要的库2. 配置邮件服务器参数3. 创建邮件发送类4. 实现邮件

Linux系统中的firewall-offline-cmd详解(收藏版)

《Linux系统中的firewall-offline-cmd详解(收藏版)》firewall-offline-cmd是firewalld的一个命令行工具,专门设计用于在没有运行firewalld服务的... 目录主要用途基本语法选项1. 状态管理2. 区域管理3. 服务管理4. 端口管理5. ICMP 阻断