将一个文件夹的pdf都去掉第一页后生成在另一个文件夹

本文主要是介绍将一个文件夹的pdf都去掉第一页后生成在另一个文件夹，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

一.前言

二.环境配置

三.完整代码

一.前言

在日常的工作和学习中，我们经常需要处理大量的PDF文件。有时候，我们可能希望将一个文件夹中的所有PDF文件进行一些特定的操作，例如去掉每个PDF文件的第一页。

为了解决这个问题，本项目旨在提供一个自动化的解决方案，可以批量处理一个文件夹中的PDF文件，并将处理后的文件生成到另一个目标文件夹中。

该项目采用了Python编程语言，并利用了一些强大的库来实现功能。其中，我们使用了pdf2image库将PDF文件转换为图片格式，然后再利用img2pdf库将图片重新转换为PDF文件。通过这种方式，我们可以轻松地对每个PDF文件进行操作并去除第一页。

同时，为了确保项目的灵活性和易用性，我们为用户提供了可配置的参数，包括输入文件夹路径、输出文件夹路径等，以便根据实际需求进行自定义设置。

通过本项目，您将能够快速、高效地处理一个文件夹中的PDF文件，去掉每个文件的第一页，并生成到指定的目标文件夹中。这将极大地提升您的工作效率和操作便利性。

请尽情享受本项目带来的便利，希望它能对您的工作和学习有所帮助！

二.环境配置

安装好这个：

Release Release 24.02.0-0 · oschwartz10612/poppler-windows · GitHub

三.完整代码

import os
import glob
from pdf2image import convert_from_path
from PIL import Image
import img2pdfdef remove_first_page(input_folder, output_folder):# 获取目录中的所有PDF文件pdf_files = glob.glob(os.path.join(input_folder, '*.pdf'))for pdf_file in pdf_files:# 将PDF文件转换为图片images = convert_from_path(pdf_file)# 删除第一页图片images = images[1:]# 创建输出文件夹路径及新PDF文件名output_file = os.path.join(output_folder, os.path.basename(pdf_file))# 创建临时文件夹保存图片temp_folder = './temp'os.makedirs(temp_folder, exist_ok=True)# 保存图片到临时文件夹for i, image in enumerate(images):image.save(os.path.join(temp_folder, f'{i}.jpg'), 'JPEG')# 将图片转换回PDF并保存with open(output_file, 'wb') as f:f.write(img2pdf.convert([os.path.join(temp_folder, page) for page in os.listdir(temp_folder)]))# 删除临时文件夹及其中的图片for file in os.listdir(temp_folder):os.remove(os.path.join(temp_folder, file))os.rmdir(temp_folder)
input_dir = 'input'
output_dir = 'output'remove_first_page(input_dir, output_dir)

这篇关于将一个文件夹的pdf都去掉第一页后生成在另一个文件夹的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！