Github上2700多星的Python公式识别项目,超两万多次下载,实力不言而喻

本文主要是介绍Github上2700多星的Python公式识别项目,超两万多次下载,实力不言而喻,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

a7b5231f2660551397e5f242bb28f124.png

最近有不少伙伴在交流群和公众号里面询问公式识别的工具。毫无疑问,目前在公式识别领域遥遥领先于同行的Mathpix是最佳的选择,咱之前在公众号里分别推荐了ta的软件包(科研必备神器推荐之Mathpix公式识别提取)和Mathpix API的matlab版调用方法(公式识别神器Mathpix for matlab 1.0.0版正式发布)。前者若是普通邮箱,每月可以免费使用50次识别,若是教育网邮箱,则每月可以免费使用100次识别;若使用后者API调用方式,则每月可以免费使用1000次免费识别,当然需要有信用卡先注册相应的账号才能使用,过程虽说不复杂,但有的伙伴反馈注册验证过程中往往会出现掉链子的情况。

既然是如此复杂,何必这般操心呢?真正免费的、离线的ta用起来不香吗?其今天即将给伙伴分享的这个公式识别工具其实很久之前就在公众号铁粉专属交流群—科研学术交流群里给他们分享过。不过看大家对公式识别需求这么大,咱就把这个压箱底(当然咱的箱底里可不止这一款)的工具分享出来,当然不排除咱们的关注者中已经有人在使用了这款工具。

今天分享的这款公式识别神器是由大神Lukas-Blecher开发的,采用Python语言编写,在Github中获得2.7K stars和311次forks,从上线至今,平均每月有超过3500次下载,火爆程度杠杠的。

52f13065faf7eca51dca467a4d2dce73.png

a6277dbf7ffe0ef5643629f04cce8a55.png

LaTex OCR的识别技术路线如下:

e550a253b3d3c81a10a6702544e7fb5d.png

其中最方便的莫过于它添加了GUI界面,可以直接截图识别而无需使用命令行操作。

LaTex-OCR的运行环境要求Python的版本3.7+,并安装相应依赖文件,如PyTorch,详情见setup.py文件中。LaTex-OCR提供三种包:GUI、API和Train,以下是三种包的安装命令:

① pix2tex[gui] (界面版,在CMD中输入latexocr命令直接调出GUI使用),安装命令为:

pip install pix2tex[gui]

② pix2tex[api] (API形式,Streamlit和docker),安装命令为:

pip install -U pix2tex[api]

③ pix2tex[train] (训练模块,支持用户训练自己的公式数据库,增强模型的自我创新能力),安装命令为:

pip install pix2tex[train]

测试效果动画:

0c1a396b39166b2e529d0ff740996cab.gif

以上就是今天分享的全部内容,望伙伴用得愉快,使用中若遇到什么问题,欢迎留言或直接到Latex-OCR项目的issue区搜寻答案或提问。

祝伙伴们生活、工作愉快,有缘再见!!!

参考资料:github.com/lukas-blecher/LaTeX-OCR

如需转载,请在公众号中回复“转载”获取授权,如未经授权擅自搬运抄袭的,本公众号将保留一切追责权利!

这篇关于Github上2700多星的Python公式识别项目,超两万多次下载,实力不言而喻的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!


原文地址:https://blog.csdn.net/rz1314/article/details/129373767
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.chinasem.cn/article/663088

相关文章

Python FastMCP构建MCP服务端与客户端的详细步骤

《PythonFastMCP构建MCP服务端与客户端的详细步骤》MCP(Multi-ClientProtocol)是一种用于构建可扩展服务的通信协议框架,本文将使用FastMCP搭建一个支持St... 目录简介环境准备服务端实现(server.py)客户端实现(client.py)运行效果扩展方向常见问题结

详解如何使用Python构建从数据到文档的自动化工作流

《详解如何使用Python构建从数据到文档的自动化工作流》这篇文章将通过真实工作场景拆解,为大家展示如何用Python构建自动化工作流,让工具代替人力完成这些数字苦力活,感兴趣的小伙伴可以跟随小编一起... 目录一、Excel处理:从数据搬运工到智能分析师二、PDF处理:文档工厂的智能生产线三、邮件自动化:

Python实现自动化Word文档样式复制与内容生成

《Python实现自动化Word文档样式复制与内容生成》在办公自动化领域,高效处理Word文档的样式和内容复制是一个常见需求,本文将展示如何利用Python的python-docx库实现... 目录一、为什么需要自动化 Word 文档处理二、核心功能实现:样式与表格的深度复制1. 表格复制(含样式与内容)2

python获取cmd环境变量值的实现代码

《python获取cmd环境变量值的实现代码》:本文主要介绍在Python中获取命令行(cmd)环境变量的值,可以使用标准库中的os模块,需要的朋友可以参考下... 前言全局说明在执行py过程中,总要使用到系统环境变量一、说明1.1 环境:Windows 11 家庭版 24H2 26100.4061

springboot项目中使用JOSN解析库的方法

《springboot项目中使用JOSN解析库的方法》JSON,全程是JavaScriptObjectNotation,是一种轻量级的数据交换格式,本文给大家介绍springboot项目中使用JOSN... 目录一、jsON解析简介二、Spring Boot项目中使用JSON解析1、pom.XML文件引入依

Python中文件读取操作漏洞深度解析与防护指南

《Python中文件读取操作漏洞深度解析与防护指南》在Web应用开发中,文件操作是最基础也最危险的功能之一,这篇文章将全面剖析Python环境中常见的文件读取漏洞类型,成因及防护方案,感兴趣的小伙伴可... 目录引言一、静态资源处理中的路径穿越漏洞1.1 典型漏洞场景1.2 os.path.join()的陷

Python数据分析与可视化的全面指南(从数据清洗到图表呈现)

《Python数据分析与可视化的全面指南(从数据清洗到图表呈现)》Python是数据分析与可视化领域中最受欢迎的编程语言之一,凭借其丰富的库和工具,Python能够帮助我们快速处理、分析数据并生成高质... 目录一、数据采集与初步探索二、数据清洗的七种武器1. 缺失值处理策略2. 异常值检测与修正3. 数据

Python中bisect_left 函数实现高效插入与有序列表管理

《Python中bisect_left函数实现高效插入与有序列表管理》Python的bisect_left函数通过二分查找高效定位有序列表插入位置,与bisect_right的区别在于处理重复元素时... 目录一、bisect_left 基本介绍1.1 函数定义1.2 核心功能二、bisect_left 与

Python使用Tkinter打造一个完整的桌面应用

《Python使用Tkinter打造一个完整的桌面应用》在Python生态中,Tkinter就像一把瑞士军刀,它没有花哨的特效,却能快速搭建出实用的图形界面,作为Python自带的标准库,无需安装即可... 目录一、界面搭建:像搭积木一样组合控件二、菜单系统:给应用装上“控制中枢”三、事件驱动:让界面“活”

VSCode设置python SDK路径的实现步骤

《VSCode设置pythonSDK路径的实现步骤》本文主要介绍了VSCode设置pythonSDK路径的实现步骤,包括命令面板切换、settings.json配置、环境变量及虚拟环境处理,具有一定... 目录一、通过命令面板快速切换(推荐方法)二、通过 settings.json 配置(项目级/全局)三、