C#实现查找并删除PDF中的空白页面

2025-05-12 14:50

本文主要是介绍C#实现查找并删除PDF中的空白页面,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

《C#实现查找并删除PDF中的空白页面》PDF文件中的空白页并不少见,因为它们有可能是作者有意留下的,也有可能是在处理文档时不小心添加的,下面我们来看看如何使用Spire.PDFfor.NET通过C#...

PDF 文件中的空白页并不少见,因为它们有可能是作者有意留下的,也有可能是在处理文档时不小心添加的。在阅读或打印文档时,这些空白页可能会比较麻烦,因此很有必要删除它们。在本文中,您将学习如何使用 Spire.PDF for .NET 通过 C# 查找和并删除 PDF 文档中的空白页

安装 Spire.PDF for .NET

首先,您需要添加 Spire.PDF for .NET 包中包含的 DLL 文件作为 .NET 项目中的引用。

PM> Install-Package Spire.PDF

C# 查找并删除 PDF 文档中的空白页

Spire.PDF for .NET 提供了 PdfPageBase.IsBlank() 方法来检测 PDF 页面是否为绝对空白。但有些页面看起来是空白的,但实际上包含了白色 图像,使用 PdfPageBase.IsBlank() 方法并无法将这些页面视为空白页面。因此,需要创建一个自定义方法 IsImageBlank() 来检测这些白色但非空白的页面。

具体步骤如下:

  • 创建 PdfDocument 对象。
  • 使用 PdfDocument.LoadFromFile() 方法加载 PDF 文件。
  • 遍历 PDF 文档中的页面,并使用 PdfPageBase.IsBlank() 方法检测页面是否为空白页面。
  • 使用 PdfDocument.Pages.RemoveAt() 方法删除绝对空白的页面。
  • 对于非绝对空白的页面,使用 PdfDocument.SaveAsImage() 方法将其保存为图像。然后使用自定义方法 IsImageBlank() 检测转换后的图像是否空白,如果是,则使用 PdfDocument.Pages.RemoveAt() 方法删除这些“空白”页面。
  • 使用 PdfDocument.SaveToFile() 方法保存结果文档。
using Spire.Pdf;
using Spire.Pdf.Graphics;
using System.Drawing;

namespace DeleteBlankPage
{
    class Program
    {
        static void Main(string[] args)
        {
            // 应用授权China编程
            Spire.Pdf.License.LicenseProvider.SetLicenseKey("your license key");

            // 创建 PdfDocument 对象
            PdfDocument document = new PdfDocument();

            // 加载 PDF 文档
            document.LoadFromFile("汇报.pdf");

            // 遍历PDF中的页面
            for (int i = document.Pages.Count - 1; i >= 0; i--)
            {
                // 检测页面是否为空白
                if (document.Pages[i].IsBlank())
                {
                    // 删除绝对空白页
                    document.Pages.RemoveAt(i);
                }
                else
                {
                    // 将 PDF 页面保存为图像
                    Image image = document.SaveAsImage(i, PdfImageType.Bitmap);

                    // 检测转换后的图像是否为空白
                    if (IsImageBlank(image))
                    {
                        // 如果是,则删除页面
                        document.Pages.RemoveAt(i);
                    }
                }
            }

            // 保存结果文档
            document.SaveToFile("删除空白页.pdf", FileFormat.PDF);
 php       }

        // 检测图像是否为空白
        public static bool IsImageBlank(Image image)
        {
            Bitmap bitmap = new Bitmap(image);
            for (int i = 0; i < bitmap.Width; i++)
            {
                for (int j = 0; j < bitmap.Height; j++)
                {
                    Color pixel = bitmap.GetPixel(i, j);
                    if (pixel.R < 240 || pixel.G < 240 || pixel.B < 240)
                    {
                        return false;
                    }
                }
            }
            return true;
        }
    }
}

效果如下

C#实现查找并删除PDF中的空白页面

C# 添加与删除PDF空白页

工具使用

这里示例中使用的是免费版的.NET PDF控件 Free Spire.PDF for .NET(添加dll引用时,可在安装路径下的Bin文件夹中获取dll文件)

测试文档截图(文档包含两页内容):

C#实现查找并删除PDF中的空白页面

添加PDF空白页

1.在默认位置,即文档末插入一张空白页

            //创建PDF文档1,并加载测试文档
            PdfDocument doc1 = new PdfDocument();
            doc1.LoadFromFile("sample.pdf");
 
            //添加一页空白页到文档(默认在文档最后一页添加)
            doc1.Pages.Add();
            //保存并打开文档
            doc1.SaveToFile("result1.pdf");
            System.Diagnostics.Process.Start("result1.pdf");

测试结果:

C#实现查找并删除PDF中的空白页面

2.在指定位置插入空白页

           //创建文档2,加载测试文档
            PdfDocument doc2 = new PdfDocument();
            doc2.LoadFromFile("sample.pdf");
 
            //添加一页空白页作为第2页
            doc2.Pages.Insert(1);
 
            //保存并打开文档
            doc2.SaveToFile("result2.pdf");
            System.Diagnostics.Process.Start("result2.pdf");

测试结果:

C#实现查找并删除PDF中的空白页面

删除PDF空白页

测试文档:

C#实现查找并删除PDF中的空白页面

这里的测试文档中,包含了两页空白页,一页空白页是没有任何内容的;另一页空白页是包含了空白图片的页面,看似没有内容,但是这样的页面实际上也是不需要的。

using Spire.Pdf;
using System.Drawing;
using Spire.Pdf.Graphics;
 
namespace DeleteBlankPage_PDF
{
    class Program
    {
        static void Main(string[] args)
        {
            //应用许可证
            Spire.License.LicenseProvider.SetLicenseFileName("liceChina编程nse.elic.XML");
 
            //创建PdfDocument类对象,并加载PDF文档
            PdfDocument document = new PdfDocument();
            document.LoadFromFile("Test.pdf");
 
            //遍历文档中所有页面 
            for (int i = document.Pages.Count - 1; i >= 0; i--)
            {
                //诊断页面是否为空白页
                if (document.Pages[i].IsBlank())
                {
                    //删除空白页 
                    document.Pages.RemoveAt(i);
                }
                else
                {
                    //将PDF页转换为Bitmap图像
                    Image image = document.SaveAsImage(i, PdfImageType.Bitmap);
 
                    //诊断图片是否为空白图片
                    if (IsImageBlank(image))
                    {
                        //移除包含空白图片的页面
                        document.Pages.RemoveAt(i);
                    }
                }
            }
 
            //保存并打开文档
            document.SaveToFile("RemoveBlankPage.pdf", FileFormat.PDF);
            System.Diagnojavascriptstics.Process.Start("RemoveBlankPage.pdf");
        }
 
        //自定义方法IsImageBlank()诊断图片是否为空白图片
        public static bool IsImageBlank(Image image)
        {
            //初始化Bitmap类实例,遍历文档中所有图片
            Bitmap bitmap = new Bitmap(image);
            for (int i = 0; i < bitmap.Width; i++)
            {
                for (int j = 0; j < bitmap.Height; j++)
                {
                    Color pixel = bitmap.GetPixel(i, j);
                    if (pixel.R < http://www.chinasem.cn240 || pixel.G < 240 || pixel.B < 240)
                    {
                        return false;
                    }
                }
            }
            return true;
        }
    }
}

测试结果:

C#实现查找并删除PDF中的空白页面

附:vb.net代码(删除PDF空白页)

Imports Spire.Pdf
Imports System.Drawing
Imports Spire.Pdf.Graphics
 
Namespace DeleteBlankPage_PDF
 
    Class Program
 
        Private Shared Sub Main(ByVal args As String())
            Spire.License.LicenseProvider.SetLicenseFileName("license.elic.xml")
            Dim document As PdfDocument = New PdfDocument()
            document.LoadFromFile("Test.pdf")
            For i As Integer = document.Pages.Count - 1 To 0
                If document.Pages(i).IsBlank() Then
                    document.Pages.RemoveAt(i)
                Else
                    Dim image As Image = document.SaveAsImage(i, PdfImageType.Bitmap)
                    If IsImageBlank(image) Then
                        document.Pages.RemoveAt(i)
                    End If
                End If
            Next
 
            document.SaveToFile("RemoveBlankPage.pdf", FileFormat.PDF)
            System.Diagnostics.Process.Start("RemoveBlankPage.pdf")
        End Sub
 
        Public Shared Function IsImageBlank(ByVal image As Image) As Boolean
            Dim bitmap As Bitmap = New Bitmap(image)
            For i As Integer = 0 To bitmap.Width - 1
                For j As Integer = 0 To bitmap.Height - 1
                    Dim pixel As Color = bitmap.GetPixel(i, j)
                    If pixel.R < 240 OrElse pixel.G < 240 OrElse pixel.B < 240 Then
                        Return False
                    End If
                Next
            Next
 
            Return True
        End Function
    End Class
End Namespace

到此这篇关于C#实现查找并删除PDF中的空白页面的文章就介绍到这了,更多相关C#查找与删除PDF空白页内容请搜索China编程(www.chinasem.cn)以前的文章或继续浏览下面的相关文章希望大家以后多多支持编程China编程(www.chinasem.cn)!

这篇关于C#实现查找并删除PDF中的空白页面的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1154585

相关文章

Java实现MinIO文件上传的加解密操作

《Java实现MinIO文件上传的加解密操作》在云存储场景中,数据安全是核心需求之一,MinIO作为高性能对象存储服务,支持通过客户端加密(CSE)在数据上传前完成加密,下面我们来看看如何通过Java... 目录一、背景与需求二、技术选型与原理1. 加密方案对比2. 核心算法选择三、完整代码实现1. 加密上

Java使用WebView实现桌面程序的技术指南

《Java使用WebView实现桌面程序的技术指南》在现代软件开发中,许多应用需要在桌面程序中嵌入Web页面,例如,你可能需要在Java桌面应用中嵌入一部分Web前端,或者加载一个HTML5界面以增强... 目录1、简述2、WebView 特点3、搭建 WebView 示例3.1 添加 JavaFX 依赖3

使用Python和SQLAlchemy实现高效的邮件发送系统

《使用Python和SQLAlchemy实现高效的邮件发送系统》在现代Web应用中,邮件通知是不可或缺的功能之一,无论是订单确认、文件处理结果通知,还是系统告警,邮件都是最常用的通信方式之一,本文将详... 目录引言1. 需求分析2. 数据库设计2.1 User 表(存储用户信息)2.2 CustomerO

通过C#获取Excel单元格的数据类型的方法详解

《通过C#获取Excel单元格的数据类型的方法详解》在处理Excel文件时,了解单元格的数据类型有助于我们正确地解析和处理数据,本文将详细介绍如何使用FreeSpire.XLS来获取Excel单元格的... 目录引言环境配置6种常见数据类型C# 读取单元格数据类型引言在处理 Excel 文件时,了解单元格

C#实现高性能Excel百万数据导出优化实战指南

《C#实现高性能Excel百万数据导出优化实战指南》在日常工作中,Excel数据导出是一个常见的需求,然而,当数据量较大时,性能和内存问题往往会成为限制导出效率的瓶颈,下面我们看看C#如何结合EPPl... 目录一、技术方案核心对比二、各方案选型建议三、性能对比数据四、核心代码实现1. MiniExcel

在React聊天应用中实现图片上传功能

《在React聊天应用中实现图片上传功能》在现代聊天应用中,除了文字和表情,图片分享也是一个重要的功能,本文将详细介绍如何在基于React的聊天应用中实现图片上传和预览功能,感兴趣的小伙伴跟着小编一起... 目录技术栈实现步骤1. 消息组件改造2. 图片预览组件3. 聊天输入组件改造功能特点使用说明注意事项

VSCode中配置node.js的实现示例

《VSCode中配置node.js的实现示例》本文主要介绍了VSCode中配置node.js的实现示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录一.node.js下载安装教程二.配置npm三.配置环境变量四.VSCode配置五.心得一.no

debian12安装docker的实现步骤

《debian12安装docker的实现步骤》本文主要介绍了debian12安装docker的实现步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着... 目录步骤 1:更新你的系统步骤 2:安装依赖项步骤 3:添加 docker 的官方 GPG 密钥步骤

基于Redis实现附近商铺查询功能

《基于Redis实现附近商铺查询功能》:本文主要介绍基于Redis实现-附近商铺查询功能,这个功能将使用到Redis中的GEO这种数据结构来实现,需要的朋友可以参考下... 目录基于Redis实现-附近查询1.GEO相关命令2.使用GEO来实现以下功能3.使用Java实现简China编程单的附近商铺查询4.Red

使用Python实现实时金价监控并自动提醒功能

《使用Python实现实时金价监控并自动提醒功能》在日常投资中,很多朋友喜欢在一些平台买点黄金,低买高卖赚点小差价,但黄金价格实时波动频繁,总是盯着手机太累了,于是我用Python写了一个实时金价监控... 目录工具能干啥?手把手教你用1、先装好这些"食材"2、代码实现讲解1. 用户输入参数2. 设置无头浏