Java高效实现Word转PDF的完整指南

2025-08-14 22:50

本文主要是介绍Java高效实现Word转PDF的完整指南,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《Java高效实现Word转PDF的完整指南》这篇文章主要为大家详细介绍了如何用Spire.DocforJava库实现Word到PDF文档的快速转换,并解析其转换选项的灵活配置技巧,希望对大家有所帮助...

Java开发中如何高效稳定地将Word文档转换为PDF格式? 这个看似简单的需求,在企业合同电子归档、财务报表批量生成等场景中,开发者往往会遇到不同的问题,如样式错乱、字体丢失等。

今天我们将通过实测代码,展示如何用 Spire.Doc for Java 库实现Word到PDF文档的快速转换,并解析其转换选项的灵活配置技巧

方法一:三步实现核心功能

步骤1:添加Maven依赖

  <repositories>
    <repository>
        <id>com.e-iceblue</id>
        <name>e-iceblue</name>
        <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
    </repository>
</repositories>
<dependencies>
    <dependency>
        <groupId>e-iceblue</groupId>
        <artifactId>spire.xls</artifactId>
        <version>15.7.7</version>
    </dependency>
</dependencies>

步骤2:核心代码示例 (支持Doc和Docx格式)

// 创建文档对象模型  
Document doc = new Document();  
// 加载Word
doc.loadFromFile("input.docx"); http://www.chinasem.cn 
// 保存为PDF
doc.saveToFile("output.pdf", FileFormat.PDF);  
doc.dispose();

步骤3:异常处理

try {  
    // 转换代码...  
} catch (DocumentException e) {  
    System.err.println("转换失败: " + e.getMessage());  
    throw new RuntimeException(e);  
}  

最佳实践

生产环境务必调用doc.close()释放资源,避免服务器出现文件句柄泄露

方法二:高级选项配置

转换过程中通过 ToPdfParameterList 对象可实现精细控制:

选项参数作用描述典型应用场景
isEmbeddedAllFonts强制嵌入所有字体系统排版一致性
setDisableLink禁用超链接安全文档转换
setPdfConformanceLevel设置PDF标准规范归档级文档(法律/医疗
setCreateWordBookmarks保留书签技术手册/论文等长文档导航

加密PDF代码示例:

// 高级转换配置示例
ToPdfParameterList options = new ToPdfParameterList();
options.setPdfConformanceLevel(PdfConformanceLevel.Pdf_A_1_B); // 符合PDF/A-1b标准
String password1 = "E-iceblue"; // 打开密码
String password2 = "123";  // 用户密码
options..getPdfSecurity().encrypt(password1, password2, PdfPermissionsFlags.None, PdfEncryptionKeySize.Key_128_Bit);  // 加密PDF
// 转换Word为PDF
Document doc = new Document();
doc.loadFromFile("机密报告.docx");
doc.saveToFile("加密文档.pdf", options);

最佳实践

转换时还可通过 setJPEGQuality 设置图片压缩质量 (0-100),以优化PDF体积。

性能优化建议

内存管理: 处理50页以上文档时,采用分段加载减少单次内存占用

批量处理:

File[] files = new File("docs/").listpythonFiles((dir, name) -> name.endsWith(".docx"));  
for (File file : files) {  
    // 循环调用转换方法...  
}  

方法补充

Java 实现 Word 转PDF方案

转换方案选择

项目开发我主要使用过 Aspose 和 LibreOffice,两者代码实现都很简单,转换效果也不错。其他生成 pdf 的方案,比如使用 html 转换、XML、或者直接操作 pdf 模板,实际使用代码逻辑繁琐不易理解,且转换生成效果一般。LibreOffice主要是后期做复杂的 pdf 模板导出,使用 word 难以动态填充内容,后来使用 excel,在 java中计算后填充 excel,设置好格式在转换拼接 pdf 最后输出。

  • Aspose:商业收费软件,免费版有水印。
  • LibreOffice:开源免费, 需要部署环境安装LibreOffice,实际使用需要控制并发与文件大小,避免对服务器整体造成影响。

Aspose 实现方案

a. 依赖注入

可以直接下载 jar 包,注入 maven 依赖后直接使用:

<dependency>
  <groupId>com.aspose</groupId>
  <artifactId>aspose-words</artifactId>
  <version>15.8.0</version>
  <scope>system</scope>
  <systemPath>${project.basedir}/src/main/resources/lib/aspose-words-15.8.0-jdk16.jar</systemPath>
</dependency>

b. 实际使用

基本用法:

// 先创建一个临时文件用来存储 PDF
String pdfPath = FileUtils.getTempDirectoryPath() + System.currentTimeMillis() + ".pdf";

/**  
 * 加载license 用于破解 不生成水印  
 */  
@SneakyThrows  
private static void getLicense() {  
    try (InputStream is = AsposeUtil.class.getClassLoader().getResourceAsStream("lib/License.xml")) {  
        License license = new License();  
        license.setLicense(is);  
    }  
}

/**
 * word转pdf
 *
 * @param wordPath word文件保存的路径
 * @param pdfPath  转换后pdf文件保存的路径
 */
public static void wordToPdf(String wordPath, String pdfPath) throws Exception {
    // 获取许可证
    getLicense();
    // 加载 Word 文档
    Document doc = new Document(wordPath);
    // 设置 PdfSaveOptions
    PdfSaveOptions options = new PdfSaveOptions();
    options.setSaveFormat(SaveFormat.PDF);
    // 保存为 PDF
    try (FileOutputStream os = new FileOutputStream(pdfPath)) {
        doc.save(os, options);
    }
}
<License>  
    <Data>  
        <Products>  
            <Product>Aspose.Total for Java</Product>  
            <Product>Aspose.Words for Java</Product>  
        </Products>  
        <EditionType>Enterprise</EditionType>  
        <SubscriptionExpiry>20991231</SubscriptionExpiry>  
        <LicenseExpiry>20991231</LicenseExpiry>  
        <SerialNumber>8bfe198c-7f0c-4ef8-8ff0-acc3237bf0d7</SerialNumber>  
    </Data>  
    <Signature>        sNLLKGMUdF0r8O1kKilWAGdgfs2BvJb/2Xp8p5iuDVfZXmhppo+d0Ran1P9TKdjV4ABwAgKXxJ3jcQTqE/2IRfqwnPf8itN8aFZlV3TJPYeD3yWE7IT55Gz6EijUpC7aKeoohTb4w2fpox58wWoF3SNp6sK6jDfiAUGEHYJ9pjU=  
    </Signature>  
</License>

c. 常见问题与解决思路

1. 字体文件缺失导致转换乱码

场景:在服务器或 docker 环境下运行,可能会因缺少字体导致 PDF 乱码。

解决方案一:将字体文件放在服务器的字体目录,Docker 可在启动时拷贝字体。

# 使用带完整字体库的基础镜像
FROM openjdk:17-jdk-slim
# 拷贝字体
COPY fonts/ /usr/share/fonts/truetype/custom/
# 刷新字体缓存
RUN fc-cache -fv

解决方案二:将字体文件放在项目的 resources/fonts 目录下,导出时拷贝到临时目录后再进行转换(只需转换一次)。

private final static String[] FONT_PATHS = {"fonts/Songti.ttc"};
fontPath = copyTempFileFont(FONT_PATHS);

/**
 * 将项目中的字体文件拷贝到临时目录
 * @return 字体目录路径
 */
private static String copyTempFileFont(String... fontPath) {
    String tempDir = System.getProperty("java.io.tmpdir");
    File fontDir = new File(tempDir, "fonts");
    if (!fontDir.exists()) {
        fontDir.mkdirs(); // 创建目录
    }
    for (String path : fontPath) {
        File tempFile = new File(fontDir, new File(path).getName());
        if (!tempFile.exists()) {
            try (InputStream inputStream = Object.class.getClassLoader().getResourceAsStream(path)) {
                FileUtils.copyInputStreamToFile(inputStream, tempFile);
            } catch (IOException e) {
                throw new RuntimeException("字体文件转换失败,请稍候重试");
            }
        }
    }
    return fontDir.getPath() + "/";
}

带字体目录的转换方法:

/**
 * word转pdf(指定字体目录)
 *
 * @param wordPath word文件保存的路径
 * @param pdfPath  转换后pdf文件保存的路径
 * @param fontPath 字体目录
 */
public static void wordToPdf(String wordPath, String pdfPath, String fontPath) throws Exception {
    // 获取许可证
    getLicense();
    // 设置字体文件夹
    FontSettings.setFontsFolder(fontPath, false);
    // 加载 Word 文档
    Document doc = new Document(wordPath);
    // 设置 PdfSaveOptions
    PdfSaveOptions options = new PdfSaveOptions();
    options.setSaveFormat(SaveFormat.PDF);
    // 保存为 PDF
    try (FileOutputStream os = new FileOutputStream(new File(pdfPath))) {
        doc.save(os, options);
    }
}

LibreOffice 实现方案(对应 excel 也可以直接使用)

a. JODConverter(调用 LibreOffice 转换)

引入依赖

<dependency>
    <groupId>org.jodconverter</groupId>
    <artifactId>jodconverter-local</artifactId>
    <version>4.4.4</version>
</dependency>

代码实现

/**
 * 转换为PDF(同时适用于 word excel)
 * @param file
 * @return
 * @throws OfficeException
 * @throws IOException
 */
public File convertToPdf(File file) throws OfficeException, IOException {
    File tempPdfFile = File.createTempFile(String.valueOf(System.currentTimeMillis()), ".pdf");
    LocalOfficeManager officeManager = null;
    try {
        officeManager = (LocalOfficeManager.builder().install()).build();
        officeManager.start();
        (LocalConverter.builder().officeManager(officeManager)).buiPMEgMld().convert(file).to(tempPdfFile).execute();
    } finally {
        if (officeManager != null) {
            officeManager.stop();
        }
    }
    return tempPdfFile;
}

拼接pdf

a. 依赖

<dependency>  
    <groupId>com.itextpdf</groupId>  
    <artifactId>itext7-core</artifactId>  
    <version>7.1.15</version>  
</dependency>

b. 实现

/**  
 * 合并PDF文件  
 */  
private void mergePdfFiles(List<File> pdfFiles, String outputPath) throws IOException {  
    try (PdfWriter writer = new PdfWriter(outputPath);  
         PdfDocument mergedDoc = new PdfDocument(writer)) {  
        PdfMerger merger = new PdfMerger(mergedDoc);  
        for (File pdfFile : pdfFiles) {  
            trywww.chinasem.cn (PdfReader reader = new PdfReader(pdfFile);  
                 PdfDocument sourceDoc = new PdfDocument(reader)) {  
                merger.merge(sourceDoc, 1, sourceDoc.getNumberOfPages());  
            }  
        }  
    }  
}

到此这篇关于Java高效实现Word转PDF的完整指南的文章就介绍到这了,更多相关Java Word转PDF内容请搜索China编程(www.chinasem.cn)http://www.chinasem.cn以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程China编程(www.chinasem.cn)!

这篇关于Java高效实现Word转PDF的完整指南的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1155738

相关文章

C#借助Spire.XLS for .NET实现在Excel中添加文档属性

《C#借助Spire.XLSfor.NET实现在Excel中添加文档属性》在日常的数据处理和项目管理中,Excel文档扮演着举足轻重的角色,本文将深入探讨如何在C#中借助强大的第三方库Spire.... 目录为什么需要程序化添加Excel文档属性使用Spire.XLS for .NET库实现文档属性管理Sp

Python+FFmpeg实现视频自动化处理的完整指南

《Python+FFmpeg实现视频自动化处理的完整指南》本文总结了一套在Python中使用subprocess.run调用FFmpeg进行视频自动化处理的解决方案,涵盖了跨平台硬件加速、中间素材处理... 目录一、 跨平台硬件加速:统一接口设计1. 核心映射逻辑2. python 实现代码二、 中间素材处

Java方法重载与重写之同名方法的双面魔法(最新整理)

《Java方法重载与重写之同名方法的双面魔法(最新整理)》文章介绍了Java中的方法重载Overloading和方法重写Overriding的区别联系,方法重载是指在同一个类中,允许存在多个方法名相同... 目录Java方法重载与重写:同名方法的双面魔法方法重载(Overloading):同门师兄弟的不同绝

Spring配置扩展之JavaConfig的使用小结

《Spring配置扩展之JavaConfig的使用小结》JavaConfig是Spring框架中基于纯Java代码的配置方式,用于替代传统的XML配置,通过注解(如@Bean)定义Spring容器的组... 目录JavaConfig 的概念什么是JavaConfig?为什么使用 JavaConfig?Jav

Java数组动态扩容的实现示例

《Java数组动态扩容的实现示例》本文主要介绍了Java数组动态扩容的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧... 目录1 问题2 方法3 结语1 问题实现动态的给数组添加元素效果,实现对数组扩容,原始数组使用静态分配

Java中ArrayList与顺序表示例详解

《Java中ArrayList与顺序表示例详解》顺序表是在计算机内存中以数组的形式保存的线性表,是指用一组地址连续的存储单元依次存储数据元素的线性结构,:本文主要介绍Java中ArrayList与... 目录前言一、Java集合框架核心接口与分类ArrayList二、顺序表数据结构中的顺序表三、常用代码手动

JAVA项目swing转javafx语法规则以及示例代码

《JAVA项目swing转javafx语法规则以及示例代码》:本文主要介绍JAVA项目swing转javafx语法规则以及示例代码的相关资料,文中详细讲解了主类继承、窗口创建、布局管理、控件替换、... 目录最常用的“一行换一行”速查表(直接全局替换)实际转换示例(JFramejs → JavaFX)迁移建

Spring Boot Interceptor的原理、配置、顺序控制及与Filter的关键区别对比分析

《SpringBootInterceptor的原理、配置、顺序控制及与Filter的关键区别对比分析》本文主要介绍了SpringBoot中的拦截器(Interceptor)及其与过滤器(Filt... 目录前言一、核心功能二、拦截器的实现2.1 定义自定义拦截器2.2 注册拦截器三、多拦截器的执行顺序四、过

Python实现快速扫描目标主机的开放端口和服务

《Python实现快速扫描目标主机的开放端口和服务》这篇文章主要为大家详细介绍了如何使用Python编写一个功能强大的端口扫描器脚本,实现快速扫描目标主机的开放端口和服务,感兴趣的小伙伴可以了解下... 目录功能介绍场景应用1. 网络安全审计2. 系统管理维护3. 网络故障排查4. 合规性检查报错处理1.

JAVA线程的周期及调度机制详解

《JAVA线程的周期及调度机制详解》Java线程的生命周期包括NEW、RUNNABLE、BLOCKED、WAITING、TIMED_WAITING和TERMINATED,线程调度依赖操作系统,采用抢占... 目录Java线程的生命周期线程状态转换示例代码JAVA线程调度机制优先级设置示例注意事项JAVA线程