使用PDFBox实现pdf转其他图片格式

2024-02-06 15:44

本文主要是介绍使用PDFBox实现pdf转其他图片格式,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近在做一个小项目,项目中有一个功能要把pdf格式的图片转换为其它格式,接下来看看用pdfbox来如何实现吧。

首先导入pdfbox相关依赖:

 <dependency> <groupId>org.apache.pdfbox</groupId> <artifactId>pdfbox</artifactId> <version>2.0.1</version> </dependency>   <dependency> <groupId>org.apache.pdfbox</groupId> <artifactId>fontbox</artifactId> <version>2.0.0</version> </dependency><dependency>  <groupId>org.apache.pdfbox</groupId> <artifactId>jempbox</artifactId> <version>1.8.11</version> </dependency> <dependency><groupId>org.apache.pdfbox</groupId> <artifactId>xmpbox</artifactId> <version>2.0.0</version> </dependency> <dependency> <groupId>org.apache.pdfbox</groupId> <artifactId>preflight</artifactId> <version>2.0.0</version> </dependency> <dependency> <groupId>org.apache.pdfbox</groupId> <artifactId>pdfbox-tools</artifactId> <version>2.0.0</version> </dependency>

接下来,控制层里面写一个方法接收三个参数(其中三个参数分别表示上传的文件,要转换的格式,输出路径):

  @ApiOperation("将pdf格式的图片装换为其它格式")@PostMapping("/pdfToimages")public R pdfToimages(@RequestPart("file") MultipartFile file, @RequestParam("type") String type,@RequestParam(value = "outpath",defaultValue = "C:\\PictureTool",required = false) String outpath){return  imagetoolService.convertToImages(file,type,outpath);}

然后是serviceimpl实现层实现对应方法(service接口此处就不做展示了,直接将serviceimpl里面的对应的方法设置为接口就行了):

/*** pdf转多张jpg(转换成多张图片)** @param file* @return*/@Overridepublic R convertToImages(MultipartFile file, String type, String outputPath) {if (file == null || file.isEmpty() || outputPath == null || outputPath.trim().isEmpty()) {// 对传入参数进行基本校验,确保它们不为空return R.Failed("请确保文件不为空且输出路径不为空。");}
//        获取文件名String filename = file.getOriginalFilename();int lastIndexOfDot = filename.lastIndexOf(".");if (lastIndexOfDot != -1) {filename = filename.substring(0, lastIndexOfDot);}System.out.println("文件名称为:" + filename);// 确保路径以分隔符结尾if (!outputPath.endsWith(File.separator)) {outputPath += File.separator;}try {// 加载PDF文件PDDocument document = PDDocument.load(file.getBytes());// 创建PDF渲染器PDFRenderer pdfRenderer = new PDFRenderer(document);// 使用ByteArrayOutputStream来构建ZIP文件的内容ByteArrayOutputStream baosZip = new ByteArrayOutputStream();ZipOutputStream zipOut = new ZipOutputStream(baosZip);// 遍历PDF中的每一页,并将其添加到ZIP流中for (int page = 0; page < document.getNumberOfPages(); page++) {// 使用300 DPI渲染图片BufferedImage image = pdfRenderer.renderImageWithDPI(page, 300, ImageType.RGB);// 创建输出流缓存图像数据ByteArrayOutputStream baosImage = new ByteArrayOutputStream();// 保存图片到缓存流ImageIO.write(image, type, baosImage);// 将图像字节添加到ZIP文件中zipOut.putNextEntry(new ZipEntry(file.getOriginalFilename() + "_page_" + (page + 1) + "." + type));zipOut.write(baosImage.toByteArray());zipOut.closeEntry();}// 完成ZIP输出流写入操作并关闭之IOUtils.closeQuietly(zipOut);// 关闭PDF文档IOUtils.closeQuietly(document);// 创建用户指定的文件,用于保存ZIPString zipFilename = filename + "_converted_images_" + type + ".zip";File outputFile = new File(outputPath + zipFilename);FileUtils.writeByteArrayToFile(outputFile, baosZip.toByteArray());// 返回成功的状态响应return R.Success("转换成功,保存路径为:" + outputFile.getAbsolutePath(), 200);} catch (IOException e) {// 发生异常时打印堆栈跟踪并返回错误信息e.printStackTrace();return R.Failed(500, "转换失败:" + e.getMessage());}}

此处的R是我自己做的一个返回响应类,读者可以根据自己项目的实际情况设置自己的响应类,或者后台私信我获取,代码中均做有注释,若有疑问之处请留言~

项目成功运行之后会根据指定文件名的生成规则生成一个压缩包到指定的文件中,若没有指定文件则会用默认的文件生成路径。

接下来使用postman进行运行:

运行成功后,便可以在对应文件夹下面查看对应生成成功的文件:

后面直接将文件解压缩即可~

这篇关于使用PDFBox实现pdf转其他图片格式的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/684793

相关文章

使用Python和OpenCV库实现实时颜色识别系统

《使用Python和OpenCV库实现实时颜色识别系统》:本文主要介绍使用Python和OpenCV库实现的实时颜色识别系统,这个系统能够通过摄像头捕捉视频流,并在视频中指定区域内识别主要颜色(红... 目录一、引言二、系统概述三、代码解析1. 导入库2. 颜色识别函数3. 主程序循环四、HSV色彩空间详解

Windows下C++使用SQLitede的操作过程

《Windows下C++使用SQLitede的操作过程》本文介绍了Windows下C++使用SQLite的安装配置、CppSQLite库封装优势、核心功能(如数据库连接、事务管理)、跨平台支持及性能优... 目录Windows下C++使用SQLite1、安装2、代码示例CppSQLite:C++轻松操作SQ

PostgreSQL中MVCC 机制的实现

《PostgreSQL中MVCC机制的实现》本文主要介绍了PostgreSQL中MVCC机制的实现,通过多版本数据存储、快照隔离和事务ID管理实现高并发读写,具有一定的参考价值,感兴趣的可以了解一下... 目录一 MVCC 基本原理python1.1 MVCC 核心概念1.2 与传统锁机制对比二 Postg

SpringBoot整合Flowable实现工作流的详细流程

《SpringBoot整合Flowable实现工作流的详细流程》Flowable是一个使用Java编写的轻量级业务流程引擎,Flowable流程引擎可用于部署BPMN2.0流程定义,创建这些流程定义的... 目录1、流程引擎介绍2、创建项目3、画流程图4、开发接口4.1 Java 类梳理4.2 查看流程图4

C++中零拷贝的多种实现方式

《C++中零拷贝的多种实现方式》本文主要介绍了C++中零拷贝的实现示例,旨在在减少数据在内存中的不必要复制,从而提高程序性能、降低内存使用并减少CPU消耗,零拷贝技术通过多种方式实现,下面就来了解一下... 目录一、C++中零拷贝技术的核心概念二、std::string_view 简介三、std::stri

Python常用命令提示符使用方法详解

《Python常用命令提示符使用方法详解》在学习python的过程中,我们需要用到命令提示符(CMD)进行环境的配置,:本文主要介绍Python常用命令提示符使用方法的相关资料,文中通过代码介绍的... 目录一、python环境基础命令【Windows】1、检查Python是否安装2、 查看Python的安

C++高效内存池实现减少动态分配开销的解决方案

《C++高效内存池实现减少动态分配开销的解决方案》C++动态内存分配存在系统调用开销、碎片化和锁竞争等性能问题,内存池通过预分配、分块管理和缓存复用解决这些问题,下面就来了解一下... 目录一、C++内存分配的性能挑战二、内存池技术的核心原理三、主流内存池实现:TCMalloc与Jemalloc1. TCM

OpenCV实现实时颜色检测的示例

《OpenCV实现实时颜色检测的示例》本文主要介绍了OpenCV实现实时颜色检测的示例,通过HSV色彩空间转换和色调范围判断实现红黄绿蓝颜色检测,包含视频捕捉、区域标记、颜色分析等功能,具有一定的参考... 目录一、引言二、系统概述三、代码解析1. 导入库2. 颜色识别函数3. 主程序循环四、HSV色彩空间

Python并行处理实战之如何使用ProcessPoolExecutor加速计算

《Python并行处理实战之如何使用ProcessPoolExecutor加速计算》Python提供了多种并行处理的方式,其中concurrent.futures模块的ProcessPoolExecu... 目录简介完整代码示例代码解释1. 导入必要的模块2. 定义处理函数3. 主函数4. 生成数字列表5.

Python中help()和dir()函数的使用

《Python中help()和dir()函数的使用》我们经常需要查看某个对象(如模块、类、函数等)的属性和方法,Python提供了两个内置函数help()和dir(),它们可以帮助我们快速了解代... 目录1. 引言2. help() 函数2.1 作用2.2 使用方法2.3 示例(1) 查看内置函数的帮助(