百度ai ocr 文字识别 安卓SDK导入防坑记

2023-11-08 22:40

本文主要是介绍百度ai ocr 文字识别 安卓SDK导入防坑记,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

因为学校课程项目需要涉及到人工智能部分,我们希望在原有记账app的基础上实现一些账单识别的功能,于是选择调用百度ocr api(免费 )来实现识别发票和车票等功能。

本文是在原有项目的基础上引入sdk,期间遇到一些问题(比如百度官方自己给的demo在我电脑上甚至跑不了,又比如经典版本问题包冲突 ),文档又没有类似的问题,希望可以分享出来让大家避坑。

重要链接:
百度sdk
百度安卓sdk快速入门
百度控制台
百度文字识别文档
百度定额发票识别
类似项目OCR 身份证识别

1. SDK流程

百度安卓sdk快速入门
先把这个流程过一遍
在这里插入图片描述

  1. 前往SDK下载页面下载Android SDK压缩包。
  2. (必须)将下载包libs目录中的ocr-sdk.jar文件拷贝到工程libs目录中,并加入工程依赖。在原本项目里面添加一个libs文件夹(如果没有的话)。在build.gradle里第41行添加工程依赖(如果没有的话 我当时好像原本就有了,没有做任何操作)

添加一个lib包
在这里插入图片描述

  1. (必须)将libs目录下armeabi,arm64-v8a,armeabi-v7a,x86文件夹按需添加到android studio工程src/main/jniLibs目录中, eclipse用户默认为libs目录。

在这里插入图片描述

  1. (可选)如果需要使用UI模块,请在Android studio中以模块方式导入下载包中的ocr-ui文件夹。这部分推荐大家使用,相当于集成好了,直接调用里面的代码就可以。

前面三步都还好,大家要是把第四步的步骤做完了就会发现一片全红
然后问题基本上就出在这里了!
在这里插入图片描述

2.解决导入module的问题

需要修改的部分挺多的
我们先从导入的module开始:

  1. build.gradle版本问题
    app和新导入的module两个版本不相容。我们得修改然后统一,这个是根据你原本项目的build.gradle来修改module的 在这里插入图片描述
  2. 其次是包的版本问题
    比如
    implementation 'com.android.support:appcompat-v7:25.1.1' 标红了
    因为我的版本最新的,这以前的包不能用,建议直接百度都有的,修改下换一个新包就ok ,像我就换成了
    implementation 'androidx.appcompat:appcompat:1.1.0'' 在这里插入图片描述
  3. 同理很多代码也标红了
    其实观察一下就会发现还是版本的问题,之前都是老版本
    import 老版本的
    在这里插入图片描述
    就是把这些包更改下,直接baidu搜索。举个例子,下面两个代码,我上面注释的报错的,下面的是我自己修改的
    com/baidu/ocr/ui/camera/Camera1Control.java在这里插入图片描述
    com/baidu/ocr/ui/camera/Camera2Control.java在这里插入图片描述
    等改好后不报错,module就可以用了

3.代码移入

当你解决ocr_ui的module导入的问题后,直接把代码拷进来,问题就不大了
具体怎么用可以看OCR 身份证识别
(看不懂的话我后期补一篇博客 其实就是嗯用就完事了)
看懂后直接copy他的代码放在自己项目里面(可以新建一个包)
等我缓缓给大家写一篇博客怎么使用

这篇关于百度ai ocr 文字识别 安卓SDK导入防坑记的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/372904

相关文章

Java easyExcel实现导入多sheet的Excel

《JavaeasyExcel实现导入多sheet的Excel》这篇文章主要为大家详细介绍了如何使用JavaeasyExcel实现导入多sheet的Excel,文中的示例代码讲解详细,感兴趣的小伙伴可... 目录1.官网2.Excel样式3.代码1.官网easyExcel官网2.Excel样式3.代码

Python中图片与PDF识别文本(OCR)的全面指南

《Python中图片与PDF识别文本(OCR)的全面指南》在数据爆炸时代,80%的企业数据以非结构化形式存在,其中PDF和图像是最主要的载体,本文将深入探索Python中OCR技术如何将这些数字纸张转... 目录一、OCR技术核心原理二、python图像识别四大工具库1. Pytesseract - 经典O

Python基于微信OCR引擎实现高效图片文字识别

《Python基于微信OCR引擎实现高效图片文字识别》这篇文章主要为大家详细介绍了一款基于微信OCR引擎的图片文字识别桌面应用开发全过程,可以实现从图片拖拽识别到文字提取,感兴趣的小伙伴可以跟随小编一... 目录一、项目概述1.1 开发背景1.2 技术选型1.3 核心优势二、功能详解2.1 核心功能模块2.

VSCode设置python SDK路径的实现步骤

《VSCode设置pythonSDK路径的实现步骤》本文主要介绍了VSCode设置pythonSDK路径的实现步骤,包括命令面板切换、settings.json配置、环境变量及虚拟环境处理,具有一定... 目录一、通过命令面板快速切换(推荐方法)二、通过 settings.json 配置(项目级/全局)三、

Python验证码识别方式(使用pytesseract库)

《Python验证码识别方式(使用pytesseract库)》:本文主要介绍Python验证码识别方式(使用pytesseract库),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全... 目录1、安装Tesseract-OCR2、在python中使用3、本地图片识别4、结合playwrigh

Spring AI 实现 STDIO和SSE MCP Server的过程详解

《SpringAI实现STDIO和SSEMCPServer的过程详解》STDIO方式是基于进程间通信,MCPClient和MCPServer运行在同一主机,主要用于本地集成、命令行工具等场景... 目录Spring AI 实现 STDIO和SSE MCP Server1.新建Spring Boot项目2.a

MySQL Workbench工具导出导入数据库方式

《MySQLWorkbench工具导出导入数据库方式》:本文主要介绍MySQLWorkbench工具导出导入数据库方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝... 目录mysql Workbench工具导出导入数据库第一步 www.chinasem.cn数据库导出第二步

将图片导入Python的turtle库的详细过程

《将图片导入Python的turtle库的详细过程》在Python编程的世界里,turtle库以其简单易用、图形化交互的特点,深受初学者喜爱,随着项目的复杂度增加,仅仅依靠线条和颜色来绘制图形可能已经... 目录开篇引言正文剖析1. 理解基础:Turtle库的工作原理2. 图片格式与支持3. 实现步骤详解第

POI从入门到实战轻松完成EasyExcel使用及Excel导入导出功能

《POI从入门到实战轻松完成EasyExcel使用及Excel导入导出功能》ApachePOI是一个流行的Java库,用于处理MicrosoftOffice格式文件,提供丰富API来创建、读取和修改O... 目录前言:Apache POIEasyPoiEasyExcel一、EasyExcel1.1、核心特性

使用Python和PaddleOCR实现图文识别的代码和步骤

《使用Python和PaddleOCR实现图文识别的代码和步骤》在当今数字化时代,图文识别技术的应用越来越广泛,如文档数字化、信息提取等,PaddleOCR是百度开源的一款强大的OCR工具包,它集成了... 目录一、引言二、环境准备2.1 安装 python2.2 安装 PaddlePaddle2.3 安装