Aspose.PDF for Java系列1-使用前说明

2024-01-13 20:50

本文主要是介绍Aspose.PDF for Java系列1-使用前说明,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、关于pdf文件说明

什么是pdf文件?

PDF是Portable Document Format的缩写,用来以电子形式显示文档,不受软件、硬件或者操作系统的影响。
最初是由Adobe开发,是一种基于PostScript格式的通用兼容文件格式,现在已成为交换文档和信息的国际标准。

PDF文档是文本和二进制数据的组合。如果在文本编辑器中打开,可以看到定义文档机构和具体内容的原始对象。

PDF文档的逻辑结构是分层的,用来控制文档的绘制文档的顺序。PDF由四个部分组成:

  • 对象
  • 文件结构
  • 文档结构
  • 内容流

二、DOM API介绍

DOM(Document Object Model)是作为结构化文档面向对象模型的易中表示形式。DOM是W3C(World Wide Web Consortium)的官方标准,与语言和平台无关的结构化文档。

简单地说,DOM是标是文档结构的对象树。Aspose.PDF延用了DOM思想,还是以对象的形式表示PDF文档结构。然而,DOM的各个方面(比如他的元素)是受编程语言语法影响的。DOM的公共接口在其应用程序接口(API)中指定。

三、PDF文档结构

由于PDF文件结构是分层的,Aspose.PDF也以同样的方式访问元素。如下展示了PDF文档的逻辑结构以及Aspose.PDF DOM API如何构造。

在这里插入图片描述

四、访问PDF文档元素

Document对象是整个对象模型的更节点。Aspose.PDF允许你创建Document对象,然后访问层级结构中的所有其他对象。可以访问任何集合(Pages)或者任何单个元素(Page)。DOM API提供单个入口和出口来操作PDF文档,如下所示:

  • 打开PDF文档
  • 以DOM形式访问PDF文档结构
  • 更新PDF文档中的数据
  • 校验PDF文档
  • 导出PDF文档为不同的格式
  • 保存已更新的PDF文档

五、如何使用新的Aspose.PDF for Java API

本章将介绍新的Aspose.PDF for Java API,指导你快速轻松地入门。
请注意,有关特定功能使用的详细信息将不在该章节介绍。

Aspose.PDF for Java由两部分组成:

  • Aspose.PDF for Java DOM API
  • Aspose.PDF.Facades

后续会详细介绍。

六、Aspose.PDF for Java DOM API

新的Aspose.PDF for Java API与PDF文档一一对应,不仅在文件和文档级别,而是在对象级别处理PDF文档帮助到你。提供了更多的灵活性来访问PDF文档的所有元素和对象。使用Aspose.PDF DOM API的类,可以获得对文档元素和格式的编程式访问。新的DOM API由各种各样命名空间组成,如下:

com.aspose.pdf

这个命名空间提供了打开和保存PDF文档的文档。License类也是这个包的一部分。同时也提供了PDF相关的pages, attachments, and bookmarks,像com.aspose.pdf.Page, com.aspose.pdf.PageCollection, com.aspose.pdf.FileSpecification, com.aspose.pdf.EmbeddedFileCollection, com.aspose.pdf.OutlineItemCollection, and com.aspose.pdf.OutlineCollection等。

com.aspose.pdf.text

这个命名空间提供了处理文本以及其他一些类,比如com.aspose.pdf.Font、com.aspose.php、com.ontCollection、com.aspose.pdf.FontRepository、com.aspse.pdf.Fon tStyles、com.aspse.pdf.TextAbsorber、com.aspuse.pdf.text Fragment、,com.aspose.pdf.TextSegment和com.aspose.php TextSegmentCollection等。

com.aspose.pdf.TextOptions

这个命名空间提供了设置用于查找、编辑或者替换文本的不同选项的类,比如com.aspose.pdf.TextEditOptions、com.aspose.pdf.TextReplaceOptions和com.aspose/pdf.TextSearchOptions。

com.aspose.pdf.PdfAction

这个命名空间包含了帮助你处理PDF文档的交互式功能的类,比如处理文档和其他操作。此命名空间包含com.aspose.pdf.GoToAction、com.aspose.php、GoToRemoteAction和com.aspose.pdf、GoToURIAction等类。

com.aspose.pdf.Annotation

Annotations是PDF文档交互功能的一部分,此命名空间包含处理Annotation的类,比如com.aspose.pdf.Annotation、com.aspose.php、AnnotationCollection、com.aspose.pdf.CircleAnnotation和com.aspose.pdf、LinkAnnotation等。

com.aspose.pdf.Form

这个命名空间包含了处理PDF表单和表单字段的类,比如com.aspose.pdf.Form, com.aspose.pdf.Field, com.aspose.pdf.TextBoxField and com.aspose.pdf.OptionCollection等。

com.aspose.pdf.devices

我们可以对PDF文档执行各种操作,例如将PDF文档转换成各种格式的图像格式。但是,此类操作不属于Document对象,不对对此去拓展Document类。因此,新的DOM API单独设置了devices类。

com.aspose.pdf.facades

在Aspose.PDF for Java之前的版本,需要Aspose PDF.Kit for Java来操作现有的PDF文档。要执行旧的Aspose PDF.Kit代码,可以使用此命名空间。

这篇关于Aspose.PDF for Java系列1-使用前说明的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/602746

相关文章

Spring Boot 实现 IP 限流的原理、实践与利弊解析

《SpringBoot实现IP限流的原理、实践与利弊解析》在SpringBoot中实现IP限流是一种简单而有效的方式来保障系统的稳定性和可用性,本文给大家介绍SpringBoot实现IP限... 目录一、引言二、IP 限流原理2.1 令牌桶算法2.2 漏桶算法三、使用场景3.1 防止恶意攻击3.2 控制资源

Mac系统下卸载JAVA和JDK的步骤

《Mac系统下卸载JAVA和JDK的步骤》JDK是Java语言的软件开发工具包,它提供了开发和运行Java应用程序所需的工具、库和资源,:本文主要介绍Mac系统下卸载JAVA和JDK的相关资料,需... 目录1. 卸载系统自带的 Java 版本检查当前 Java 版本通过命令卸载系统 Java2. 卸载自定

springboot下载接口限速功能实现

《springboot下载接口限速功能实现》通过Redis统计并发数动态调整每个用户带宽,核心逻辑为每秒读取并发送限定数据量,防止单用户占用过多资源,确保整体下载均衡且高效,本文给大家介绍spring... 目录 一、整体目标 二、涉及的主要类/方法✅ 三、核心流程图解(简化) 四、关键代码详解1️⃣ 设置

Java Spring ApplicationEvent 代码示例解析

《JavaSpringApplicationEvent代码示例解析》本文解析了Spring事件机制,涵盖核心概念(发布-订阅/观察者模式)、代码实现(事件定义、发布、监听)及高级应用(异步处理、... 目录一、Spring 事件机制核心概念1. 事件驱动架构模型2. 核心组件二、代码示例解析1. 事件定义

Python中图片与PDF识别文本(OCR)的全面指南

《Python中图片与PDF识别文本(OCR)的全面指南》在数据爆炸时代,80%的企业数据以非结构化形式存在,其中PDF和图像是最主要的载体,本文将深入探索Python中OCR技术如何将这些数字纸张转... 目录一、OCR技术核心原理二、python图像识别四大工具库1. Pytesseract - 经典O

SpringMVC高效获取JavaBean对象指南

《SpringMVC高效获取JavaBean对象指南》SpringMVC通过数据绑定自动将请求参数映射到JavaBean,支持表单、URL及JSON数据,需用@ModelAttribute、@Requ... 目录Spring MVC 获取 JavaBean 对象指南核心机制:数据绑定实现步骤1. 定义 Ja

python使用库爬取m3u8文件的示例

《python使用库爬取m3u8文件的示例》本文主要介绍了python使用库爬取m3u8文件的示例,可以使用requests、m3u8、ffmpeg等库,实现获取、解析、下载视频片段并合并等步骤,具有... 目录一、准备工作二、获取m3u8文件内容三、解析m3u8文件四、下载视频片段五、合并视频片段六、错误

javax.net.ssl.SSLHandshakeException:异常原因及解决方案

《javax.net.ssl.SSLHandshakeException:异常原因及解决方案》javax.net.ssl.SSLHandshakeException是一个SSL握手异常,通常在建立SS... 目录报错原因在程序中绕过服务器的安全验证注意点最后多说一句报错原因一般出现这种问题是因为目标服务器

gitlab安装及邮箱配置和常用使用方式

《gitlab安装及邮箱配置和常用使用方式》:本文主要介绍gitlab安装及邮箱配置和常用使用方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录1.安装GitLab2.配置GitLab邮件服务3.GitLab的账号注册邮箱验证及其分组4.gitlab分支和标签的

Java实现删除文件中的指定内容

《Java实现删除文件中的指定内容》在日常开发中,经常需要对文本文件进行批量处理,其中,删除文件中指定内容是最常见的需求之一,下面我们就来看看如何使用java实现删除文件中的指定内容吧... 目录1. 项目背景详细介绍2. 项目需求详细介绍2.1 功能需求2.2 非功能需求3. 相关技术详细介绍3.1 Ja