XML-DOM SAX解析

2024-09-06 09:38
文章标签 xml 解析 dom sax

本文主要是介绍XML-DOM SAX解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

XML基础

                1)XML的作用

                                1.1 作为软件配置文件

                                1.2 作为小型的“数据库”

                2)XML语法(由w3c组织规定的)

                                标签: 

                                                标签名不能以数字开头,中间不能有空格,区分大小写。有且仅有一个根标签。

                                属性:           

                                                可有多个属性,但属性值必须用引号(单引号或双引号)包含,但不能省略,也不能单                                                双混用。

                                文档声明:

                                                <?xml version="1.0"encoding="utf-8"?>      

                                                encoding="utf-8": 打开或解析xml文档时的编码

                                                注意:

                                        保存xml文档时的编码 和 解析xml文档时的编码要保持一致,才能避免中文乱码问题!

                3)XML解析

                                程序读取或操作xml文档

 

                                两种解析方式:   DOM解析   vs   SAX解析

 

                                DOM解析原理:一次性把xml文档加载成Document树,通过Document对象得到节点对象,通过节点对象访问xml文档内容(标签,属性,文本,注释)。

 

                                Dom4j工具(基于DOM解析原理):

                                                读取xml文档:

                                                            Document doc = newSAXReader().read("xml文件");

 

                                                节点:

                                                                nodeIterator();  所有节点

                                                标签:

                                                                element("名称")   指定名称的第一个子标签对象

                                                                elementIterator("名称");  指定名称的所有子标签对象

                                                                elements();  所有子标签对象

                                                属性:

                                                                attributeValue(“名称”)指定名称的属性值

                                                                attribute("名称")   指定名称的属性对象

                                                                                getName()  属性名称

                                                                                getValue()  属性值

                                                                atributeIterator()   所有属性对象(Iterator)

                                                                attributes()       所有属性对象(List)

                                                文本:

                                                                getText()  得到当前标签的文本

                                                                elementText("子标签名称")  得到子标签的文本

               

                               

今天的目标:     Dom4J修改xml   + xPath技术  + SAX解析 + XML约束

2 Dom4j修改xml文档

                2.1 写出内容到xml文档

                                XMLWriter writer = newXMLWriter(OutputStream, OutputForamt)

                                wirter.write(Document);

 

                2.2 修改xml文档的API

                        增加:

                                        DocumentHelper.createDocument()  增加文档

                                        addElement("名称")  增加标签

                                        addAttribute("名称",“值”)  增加属性

                        修改:

                                        Attribute.setValue("值")  修改属性值

                                        Element.addAtribute("同名的属性名","值")  修改同名的属性值

                                        Element.setText("内容")  修改文本内容

                        删除

                                        Element.detach();  删除标签 

                                        Attribute.detach();  删除属性

3 xPath技术 

                        3.1引入

                        问题:当使用dom4j查询比较深的层次结构的节点(标签,属性,文本),比较麻烦!!!

                        3.2xPath作用

                                主要是用于快速获取所需的节点对象。

 

                        3.3在dom4j中如何使用xPath技术

                                1)导入xPath支持jar包。  jaxen-1.1-beta-6.jar

                                2)使用xpath方法

                                                List<Node>  selectNodes("xpath表达式");   查询多个节点对象

                                                Node       selectSingleNode("xpath表达式");  查询一个节点对象

                               

                        3.4xPath语法

                                /     绝对路径      表示从xml的根位置开始或子元素(一个层次结构)

                                //    相对路径       表示不分任何层次结构的选择元素。

                                *     通配符         表示匹配所有元素

                                []     条件           表示选择什么条件下的元素

                                @    属性            表示选择属性节点

                                and    关系          表示条件的与关系(等价于&&)

                                text()   文本           表示选择文本内容

                 3.5 案例

                                用户登录功能:

                                        用户输入用户名和密码 -> 到“数据库”查询是否有对应的用户->

                                                有: 则表示登录成功

                                                没有: 则表示登录失败

 

                                用xml当做数据库

                                                user.xml   用来存储用户的数据

 

4 SAX解析

                        4.1回顾DOM解析

                                DOM解析原理:一次性把xml文档加载进内存,然后在内存中构建Document树。

                                                                对内存要求比较要。   

                                                缺点: 不适合读取大容量的xml文件,容易导致内存溢出。

                                       

                                SAX解析原理: 加载一点,读取一点,处理一点。对内存要求比较低。

 

                        4.2SAX解析工具    

                                        SAX解析工具-  Sun公司提供的。内置在jdk中。org.xml.sax.*

 

                                        核心的API:

                                                  SAXParser类: 用于读取和解析xml文件对象

                                                                parse(File f, DefaultHandler dh)方法:解析xml文件

                               

                                                参数一: File:表示 读取的xml文件。

                                            参数二: DefaultHandler: SAX事件处理程序。使用DefaultHandler的子类

例如:{

                  1.创建SAXParser对象 

              SAXParser parser=SAXParserFactory.newInstance().newSAXParser();

                  2.调用parse方法

            parser.parse(new File("./src/contact.xml"), new MyDefaultHandler());

}               [一个类继承class 类名(extendsDefaultHandler 在调用是创建传进去

 

                                DefaultHandler类的API:

                                                void startDocument()  :  在读到文档开始时调用

                                                void endDocument()  :在读到文档结束时调用

                                                voidstartElement(String uri, String localName, String qName, Attributes attributes) :读到开始标签时调用                             

                                                voidendElement(String uri, String localName, String qName)   :读到结束标签时调用

                                                voidcharacters(char[] ch, int start, int length) 读到文本内容时调用

 

                               

                                        ============DOM解析    vs  SAX解析             ========

       

DOM解析

SAX解析

原理: 一次性加载xml文档,不适合大容量的文件读取

原理: 加载一点,读取一点,处理一点。适合大容量文件的读取

DOM解析可以任意进行增删改成

SAX解析只能读取

DOM解析任意读取任何位置的数据,甚至往回读

SAX解析只能从上往下,按顺序读取,不能往回读

DOM解析面向对象的编程方法(Node,Element,Attribute),Java开发者编码比较简单。

SAX解析基于事件的编程方法。java开发编码相对复杂。

 

                总结:

                                1)Dom4j修改xml文档

                                         new XMLWrier();

                                                ......

                                2)xPath技术: 快速查询xml节点

                                                selectNodes()

                                                selectSinglNode();

                                        xpath表达式语言         

                                3) SAX解析

                                                SAXParser parse

                                                        parser()

                                        DefaultHandler类:

                                                        startElement();

                                                        characters();

                                                        endElement();

这篇关于XML-DOM SAX解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1141665

相关文章

线上Java OOM问题定位与解决方案超详细解析

《线上JavaOOM问题定位与解决方案超详细解析》OOM是JVM抛出的错误,表示内存分配失败,:本文主要介绍线上JavaOOM问题定位与解决方案的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录一、OOM问题核心认知1.1 OOM定义与技术定位1.2 OOM常见类型及技术特征二、OOM问题定位工具

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言:解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解(高频使用)三、clean生命周期核心阶

深入解析C++ 中std::map内存管理

《深入解析C++中std::map内存管理》文章详解C++std::map内存管理,指出clear()仅删除元素可能不释放底层内存,建议用swap()与空map交换以彻底释放,针对指针类型需手动de... 目录1️、基本清空std::map2️、使用 swap 彻底释放内存3️、map 中存储指针类型的对象

Java Scanner类解析与实战教程

《JavaScanner类解析与实战教程》JavaScanner类(java.util包)是文本输入解析工具,支持基本类型和字符串读取,基于Readable接口与正则分隔符实现,适用于控制台、文件输... 目录一、核心设计与工作原理1.底层依赖2.解析机制A.核心逻辑基于分隔符(delimiter)和模式匹

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

深度解析Python yfinance的核心功能和高级用法

《深度解析Pythonyfinance的核心功能和高级用法》yfinance是一个功能强大且易于使用的Python库,用于从YahooFinance获取金融数据,本教程将深入探讨yfinance的核... 目录yfinance 深度解析教程 (python)1. 简介与安装1.1 什么是 yfinance?