PDF格式分析(二十七)Linearized PDF 线性化 - 文档结构

2024-02-04 21:08

本文主要是介绍PDF格式分析(二十七)Linearized PDF 线性化 - 文档结构,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

线性化PDF文档结构

线性化PDF文件文件中的所有间接对象应分为两组:

  • 第一组应包含文档目录,其他文档级对象以及属于文档第一页的所有对象。 这些对象应按顺序编号,从第二组最后一个编号后的第一个对象编号开始。 (包含hint表的流,称为hint流,可以不按顺序编号)。
  • 第二组应包含文档中的所有剩余对象,包括第一页之后的所有页面,所有共享对象(从多个页面引用的对象,不计算从第一页引用的对象),等等。 这些对象应从1开始按顺序编号。

这些对象组应由两个交叉引用表编制索引。 线性化PDF按顺序由11个部分组成, 所有对象的版本号均为0。

从PDF 1.5开始,PDF文件可以包含对象流(object streams )。 在包含对象流的线性化文件中,需要符合以下条件:

  • 一些附加对象可能不包含在对象流中:如线性化字典,文档目录和页面对象。
  • 存储在对象流中的对象编号,应在主要和第一页交叉引用部分中使用最高范围的对象编号。
  • 对于包含对象流的文件,hint 数据可以仅指定对象流的位置和大小(或未压缩的对象),而不是单个压缩对象。 类似地,共享对象引用应该对包含压缩对象的对象流进行,而不是对压缩对象本身进行。
  • 使用交叉引用流代替传统的交叉引用表。

Part 1: Header
线性化PDF文件应以标准的PDF文件头开头。 线性化与PDF版本号无关,可以应用于1.1或更高版本的任何PDF文件。第二行百分号(25h)后面的二进制字符是代码为128或更大的字符。

这篇关于PDF格式分析(二十七)Linearized PDF 线性化 - 文档结构的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/678799

相关文章

慢sql提前分析预警和动态sql替换-Mybatis-SQL

《慢sql提前分析预警和动态sql替换-Mybatis-SQL》为防止慢SQL问题而开发的MyBatis组件,该组件能够在开发、测试阶段自动分析SQL语句,并在出现慢SQL问题时通过Ducc配置实现动... 目录背景解决思路开源方案调研设计方案详细设计使用方法1、引入依赖jar包2、配置组件XML3、核心配

Java NoClassDefFoundError运行时错误分析解决

《JavaNoClassDefFoundError运行时错误分析解决》在Java开发中,NoClassDefFoundError是一种常见的运行时错误,它通常表明Java虚拟机在尝试加载一个类时未能... 目录前言一、问题分析二、报错原因三、解决思路检查类路径配置检查依赖库检查类文件调试类加载器问题四、常见

Python中的Walrus运算符分析示例详解

《Python中的Walrus运算符分析示例详解》Python中的Walrus运算符(:=)是Python3.8引入的一个新特性,允许在表达式中同时赋值和返回值,它的核心作用是减少重复计算,提升代码简... 目录1. 在循环中避免重复计算2. 在条件判断中同时赋值变量3. 在列表推导式或字典推导式中简化逻辑

使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)

《使用Python从PPT文档中提取图片和图片信息(如坐标、宽度和高度等)》PPT是一种高效的信息展示工具,广泛应用于教育、商务和设计等多个领域,PPT文档中常常包含丰富的图片内容,这些图片不仅提升了... 目录一、引言二、环境与工具三、python 提取PPT背景图片3.1 提取幻灯片背景图片3.2 提取

Android实现在线预览office文档的示例详解

《Android实现在线预览office文档的示例详解》在移动端展示在线Office文档(如Word、Excel、PPT)是一项常见需求,这篇文章为大家重点介绍了两种方案的实现方法,希望对大家有一定的... 目录一、项目概述二、相关技术知识三、实现思路3.1 方案一:WebView + Office Onl

HTML5表格语法格式详解

《HTML5表格语法格式详解》在HTML语法中,表格主要通过table、tr和td3个标签构成,本文通过实例代码讲解HTML5表格语法格式,感兴趣的朋友一起看看吧... 目录一、表格1.表格语法格式2.表格属性 3.例子二、不规则表格1.跨行2.跨列3.例子一、表格在html语法中,表格主要通过< tab

Java程序进程起来了但是不打印日志的原因分析

《Java程序进程起来了但是不打印日志的原因分析》:本文主要介绍Java程序进程起来了但是不打印日志的原因分析,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教... 目录Java程序进程起来了但是不打印日志的原因1、日志配置问题2、日志文件权限问题3、日志文件路径问题4、程序

Python实现word文档内容智能提取以及合成

《Python实现word文档内容智能提取以及合成》这篇文章主要为大家详细介绍了如何使用Python实现从10个左右的docx文档中抽取内容,再调整语言风格后生成新的文档,感兴趣的小伙伴可以了解一下... 目录核心思路技术路径实现步骤阶段一:准备工作阶段二:内容提取 (python 脚本)阶段三:语言风格调

Java字符串操作技巧之语法、示例与应用场景分析

《Java字符串操作技巧之语法、示例与应用场景分析》在Java算法题和日常开发中,字符串处理是必备的核心技能,本文全面梳理Java中字符串的常用操作语法,结合代码示例、应用场景和避坑指南,可快速掌握字... 目录引言1. 基础操作1.1 创建字符串1.2 获取长度1.3 访问字符2. 字符串处理2.1 子字

使用Java将DOCX文档解析为Markdown文档的代码实现

《使用Java将DOCX文档解析为Markdown文档的代码实现》在现代文档处理中,Markdown(MD)因其简洁的语法和良好的可读性,逐渐成为开发者、技术写作者和内容创作者的首选格式,然而,许多文... 目录引言1. 工具和库介绍2. 安装依赖库3. 使用Apache POI解析DOCX文档4. 将解析