【Python】读取doc文档解决思路及代码\win32com打开Office|WPS\error: (-2147352567,

本文主要是介绍【Python】读取doc文档解决思路及代码\win32com打开Office|WPS\error: (-2147352567,,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

个人搜索到当前读取doc文档的解决办法,就是通过win32com打开并转换为docx,再通过docx库读取内容。
但这其中有两个地方很容易出错,一个是打开,事实证明只有client.Dispatch('Word.Application')可用。然后保存前一定要确保doc、docx是关闭的也就是不被占用,如果漏了加doc.Close(),则会一直被挂在后台。

附上代码


import win32com.client
import os
import docxdef output_docx_content(docx_path):# 打开转换后的 .docx 文件doc = docx.Document(docx_path)# 遍历文档中的段落并输出内容for paragraph in doc.paragraphs:print(paragraph.text)# 遍历文档中的表格并输出内容for table in doc.tables:for row in table.rows:for cell in row.cells:print(cell.text)def convert_doc_to_docx(doc_path):# 创建Word对象wps = win32com.client.Dispatch("word.Application")# 打开文档doc = wps.Documents.Open(doc_path)docxNamePath = doc_path + "x"print('转换中...')if os.path.exists(docxNamePath):print(f"File '{docxNamePath}'已存在.")doc.Close()return docxNamePathdoc.SaveAs(docxNamePath, 12)print('转换完成!' + docxNamePath)doc.Close()return docxNamePath# 使用示例
doc_path = r'D:\path\document.doc'
new_docx_path = convert_doc_to_docx(doc_path)output_docx_content(new_docx_path)

这篇关于【Python】读取doc文档解决思路及代码\win32com打开Office|WPS\error: (-2147352567,的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1061298

相关文章

Python中Json和其他类型相互转换的实现示例

《Python中Json和其他类型相互转换的实现示例》本文介绍了在Python中使用json模块实现json数据与dict、object之间的高效转换,包括loads(),load(),dumps()... 项目中经常会用到json格式转为object对象、dict字典格式等。在此做个记录,方便后续用到该方

从基础到高级详解Python数值格式化输出的完全指南

《从基础到高级详解Python数值格式化输出的完全指南》在数据分析、金融计算和科学报告领域,数值格式化是提升可读性和专业性的关键技术,本文将深入解析Python中数值格式化输出的相关方法,感兴趣的小伙... 目录引言:数值格式化的核心价值一、基础格式化方法1.1 三种核心格式化方式对比1.2 基础格式化示例

Python与MySQL实现数据库实时同步的详细步骤

《Python与MySQL实现数据库实时同步的详细步骤》在日常开发中,数据同步是一项常见的需求,本篇文章将使用Python和MySQL来实现数据库实时同步,我们将围绕数据变更捕获、数据处理和数据写入这... 目录前言摘要概述:数据同步方案1. 基本思路2. mysql Binlog 简介实现步骤与代码示例1

504 Gateway Timeout网关超时的根源及完美解决方法

《504GatewayTimeout网关超时的根源及完美解决方法》在日常开发和运维过程中,504GatewayTimeout错误是常见的网络问题之一,尤其是在使用反向代理(如Nginx)或... 目录引言为什么会出现 504 错误?1. 探索 504 Gateway Timeout 错误的根源 1.1 后端

Redis实现高效内存管理的示例代码

《Redis实现高效内存管理的示例代码》Redis内存管理是其核心功能之一,为了高效地利用内存,Redis采用了多种技术和策略,如优化的数据结构、内存分配策略、内存回收、数据压缩等,下面就来详细的介绍... 目录1. 内存分配策略jemalloc 的使用2. 数据压缩和编码ziplist示例代码3. 优化的

Python ORM神器之SQLAlchemy基本使用完全指南

《PythonORM神器之SQLAlchemy基本使用完全指南》SQLAlchemy是Python主流ORM框架,通过对象化方式简化数据库操作,支持多数据库,提供引擎、会话、模型等核心组件,实现事务... 目录一、什么是SQLAlchemy?二、安装SQLAlchemy三、核心概念1. Engine(引擎)

Ubuntu如何升级Python版本

《Ubuntu如何升级Python版本》Ubuntu22.04Docker中,安装Python3.11后,使用update-alternatives设置为默认版本,最后用python3-V验证... 目China编程录问题描述前提环境解决方法总结问题描述Ubuntu22.04系统自带python3.10,想升级

解决升级JDK报错:module java.base does not“opens java.lang.reflect“to unnamed module问题

《解决升级JDK报错:modulejava.basedoesnot“opensjava.lang.reflect“tounnamedmodule问题》SpringBoot启动错误源于Jav... 目录问题描述原因分析解决方案总结问题描述启动sprintboot时报以下错误原因分析编程异js常是由Ja

Python自动化处理PDF文档的操作完整指南

《Python自动化处理PDF文档的操作完整指南》在办公自动化中,PDF文档处理是一项常见需求,本文将介绍如何使用Python实现PDF文档的自动化处理,感兴趣的小伙伴可以跟随小编一起学习一下... 目录使用pymupdf读写PDF文件基本概念安装pymupdf提取文本内容提取图像添加水印使用pdfplum

Python 基于http.server模块实现简单http服务的代码举例

《Python基于http.server模块实现简单http服务的代码举例》Pythonhttp.server模块通过继承BaseHTTPRequestHandler处理HTTP请求,使用Threa... 目录测试环境代码实现相关介绍模块简介类及相关函数简介参考链接测试环境win11专业版python