XML-DOM SAX解析

2024-09-06 09:38
文章标签 xml 解析 dom sax

本文主要是介绍XML-DOM SAX解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

XML基础

                1)XML的作用

                                1.1 作为软件配置文件

                                1.2 作为小型的“数据库”

                2)XML语法(由w3c组织规定的)

                                标签: 

                                                标签名不能以数字开头,中间不能有空格,区分大小写。有且仅有一个根标签。

                                属性:           

                                                可有多个属性,但属性值必须用引号(单引号或双引号)包含,但不能省略,也不能单                                                双混用。

                                文档声明:

                                                <?xml version="1.0"encoding="utf-8"?>      

                                                encoding="utf-8": 打开或解析xml文档时的编码

                                                注意:

                                        保存xml文档时的编码 和 解析xml文档时的编码要保持一致,才能避免中文乱码问题!

                3)XML解析

                                程序读取或操作xml文档

 

                                两种解析方式:   DOM解析   vs   SAX解析

 

                                DOM解析原理:一次性把xml文档加载成Document树,通过Document对象得到节点对象,通过节点对象访问xml文档内容(标签,属性,文本,注释)。

 

                                Dom4j工具(基于DOM解析原理):

                                                读取xml文档:

                                                            Document doc = newSAXReader().read("xml文件");

 

                                                节点:

                                                                nodeIterator();  所有节点

                                                标签:

                                                                element("名称")   指定名称的第一个子标签对象

                                                                elementIterator("名称");  指定名称的所有子标签对象

                                                                elements();  所有子标签对象

                                                属性:

                                                                attributeValue(“名称”)指定名称的属性值

                                                                attribute("名称")   指定名称的属性对象

                                                                                getName()  属性名称

                                                                                getValue()  属性值

                                                                atributeIterator()   所有属性对象(Iterator)

                                                                attributes()       所有属性对象(List)

                                                文本:

                                                                getText()  得到当前标签的文本

                                                                elementText("子标签名称")  得到子标签的文本

               

                               

今天的目标:     Dom4J修改xml   + xPath技术  + SAX解析 + XML约束

2 Dom4j修改xml文档

                2.1 写出内容到xml文档

                                XMLWriter writer = newXMLWriter(OutputStream, OutputForamt)

                                wirter.write(Document);

 

                2.2 修改xml文档的API

                        增加:

                                        DocumentHelper.createDocument()  增加文档

                                        addElement("名称")  增加标签

                                        addAttribute("名称",“值”)  增加属性

                        修改:

                                        Attribute.setValue("值")  修改属性值

                                        Element.addAtribute("同名的属性名","值")  修改同名的属性值

                                        Element.setText("内容")  修改文本内容

                        删除

                                        Element.detach();  删除标签 

                                        Attribute.detach();  删除属性

3 xPath技术 

                        3.1引入

                        问题:当使用dom4j查询比较深的层次结构的节点(标签,属性,文本),比较麻烦!!!

                        3.2xPath作用

                                主要是用于快速获取所需的节点对象。

 

                        3.3在dom4j中如何使用xPath技术

                                1)导入xPath支持jar包。  jaxen-1.1-beta-6.jar

                                2)使用xpath方法

                                                List<Node>  selectNodes("xpath表达式");   查询多个节点对象

                                                Node       selectSingleNode("xpath表达式");  查询一个节点对象

                               

                        3.4xPath语法

                                /     绝对路径      表示从xml的根位置开始或子元素(一个层次结构)

                                //    相对路径       表示不分任何层次结构的选择元素。

                                *     通配符         表示匹配所有元素

                                []     条件           表示选择什么条件下的元素

                                @    属性            表示选择属性节点

                                and    关系          表示条件的与关系(等价于&&)

                                text()   文本           表示选择文本内容

                 3.5 案例

                                用户登录功能:

                                        用户输入用户名和密码 -> 到“数据库”查询是否有对应的用户->

                                                有: 则表示登录成功

                                                没有: 则表示登录失败

 

                                用xml当做数据库

                                                user.xml   用来存储用户的数据

 

4 SAX解析

                        4.1回顾DOM解析

                                DOM解析原理:一次性把xml文档加载进内存,然后在内存中构建Document树。

                                                                对内存要求比较要。   

                                                缺点: 不适合读取大容量的xml文件,容易导致内存溢出。

                                       

                                SAX解析原理: 加载一点,读取一点,处理一点。对内存要求比较低。

 

                        4.2SAX解析工具    

                                        SAX解析工具-  Sun公司提供的。内置在jdk中。org.xml.sax.*

 

                                        核心的API:

                                                  SAXParser类: 用于读取和解析xml文件对象

                                                                parse(File f, DefaultHandler dh)方法:解析xml文件

                               

                                                参数一: File:表示 读取的xml文件。

                                            参数二: DefaultHandler: SAX事件处理程序。使用DefaultHandler的子类

例如:{

                  1.创建SAXParser对象 

              SAXParser parser=SAXParserFactory.newInstance().newSAXParser();

                  2.调用parse方法

            parser.parse(new File("./src/contact.xml"), new MyDefaultHandler());

}               [一个类继承class 类名(extendsDefaultHandler 在调用是创建传进去

 

                                DefaultHandler类的API:

                                                void startDocument()  :  在读到文档开始时调用

                                                void endDocument()  :在读到文档结束时调用

                                                voidstartElement(String uri, String localName, String qName, Attributes attributes) :读到开始标签时调用                             

                                                voidendElement(String uri, String localName, String qName)   :读到结束标签时调用

                                                voidcharacters(char[] ch, int start, int length) 读到文本内容时调用

 

                               

                                        ============DOM解析    vs  SAX解析             ========

       

DOM解析

SAX解析

原理: 一次性加载xml文档,不适合大容量的文件读取

原理: 加载一点,读取一点,处理一点。适合大容量文件的读取

DOM解析可以任意进行增删改成

SAX解析只能读取

DOM解析任意读取任何位置的数据,甚至往回读

SAX解析只能从上往下,按顺序读取,不能往回读

DOM解析面向对象的编程方法(Node,Element,Attribute),Java开发者编码比较简单。

SAX解析基于事件的编程方法。java开发编码相对复杂。

 

                总结:

                                1)Dom4j修改xml文档

                                         new XMLWrier();

                                                ......

                                2)xPath技术: 快速查询xml节点

                                                selectNodes()

                                                selectSinglNode();

                                        xpath表达式语言         

                                3) SAX解析

                                                SAXParser parse

                                                        parser()

                                        DefaultHandler类:

                                                        startElement();

                                                        characters();

                                                        endElement();

这篇关于XML-DOM SAX解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1141665

相关文章

全面解析Golang 中的 Gorilla CORS 中间件正确用法

《全面解析Golang中的GorillaCORS中间件正确用法》Golang中使用gorilla/mux路由器配合rs/cors中间件库可以优雅地解决这个问题,然而,很多人刚开始使用时会遇到配... 目录如何让 golang 中的 Gorilla CORS 中间件正确工作一、基础依赖二、错误用法(很多人一开

Mysql中设计数据表的过程解析

《Mysql中设计数据表的过程解析》数据库约束通过NOTNULL、UNIQUE、DEFAULT、主键和外键等规则保障数据完整性,自动校验数据,减少人工错误,提升数据一致性和业务逻辑严谨性,本文介绍My... 目录1.引言2.NOT NULL——制定某列不可以存储NULL值2.UNIQUE——保证某一列的每一

深度解析Nginx日志分析与499状态码问题解决

《深度解析Nginx日志分析与499状态码问题解决》在Web服务器运维和性能优化过程中,Nginx日志是排查问题的重要依据,本文将围绕Nginx日志分析、499状态码的成因、排查方法及解决方案展开讨论... 目录前言1. Nginx日志基础1.1 Nginx日志存放位置1.2 Nginx日志格式2. 499

MySQL CTE (Common Table Expressions)示例全解析

《MySQLCTE(CommonTableExpressions)示例全解析》MySQL8.0引入CTE,支持递归查询,可创建临时命名结果集,提升复杂查询的可读性与维护性,适用于层次结构数据处... 目录基本语法CTE 主要特点非递归 CTE简单 CTE 示例多 CTE 示例递归 CTE基本递归 CTE 结

Spring Boot 3.x 中 WebClient 示例详解析

《SpringBoot3.x中WebClient示例详解析》SpringBoot3.x中WebClient是响应式HTTP客户端,替代RestTemplate,支持异步非阻塞请求,涵盖GET... 目录Spring Boot 3.x 中 WebClient 全面详解及示例1. WebClient 简介2.

在MySQL中实现冷热数据分离的方法及使用场景底层原理解析

《在MySQL中实现冷热数据分离的方法及使用场景底层原理解析》MySQL冷热数据分离通过分表/分区策略、数据归档和索引优化,将频繁访问的热数据与冷数据分开存储,提升查询效率并降低存储成本,适用于高并发... 目录实现冷热数据分离1. 分表策略2. 使用分区表3. 数据归档与迁移在mysql中实现冷热数据分

C#解析JSON数据全攻略指南

《C#解析JSON数据全攻略指南》这篇文章主要为大家详细介绍了使用C#解析JSON数据全攻略指南,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录一、为什么jsON是C#开发必修课?二、四步搞定网络JSON数据1. 获取数据 - HttpClient最佳实践2. 动态解析 - 快速

Spring Boot3.0新特性全面解析与应用实战

《SpringBoot3.0新特性全面解析与应用实战》SpringBoot3.0作为Spring生态系统的一个重要里程碑,带来了众多令人兴奋的新特性和改进,本文将深入解析SpringBoot3.0的... 目录核心变化概览Java版本要求提升迁移至Jakarta EE重要新特性详解1. Native Ima

spring中的@MapperScan注解属性解析

《spring中的@MapperScan注解属性解析》@MapperScan是Spring集成MyBatis时自动扫描Mapper接口的注解,简化配置并支持多数据源,通过属性控制扫描路径和过滤条件,利... 目录一、核心功能与作用二、注解属性解析三、底层实现原理四、使用场景与最佳实践五、注意事项与常见问题六

nginx -t、nginx -s stop 和 nginx -s reload 命令的详细解析(结合应用场景)

《nginx-t、nginx-sstop和nginx-sreload命令的详细解析(结合应用场景)》本文解析Nginx的-t、-sstop、-sreload命令,分别用于配置语法检... 以下是关于 nginx -t、nginx -s stop 和 nginx -s reload 命令的详细解析,结合实际应