XML-DOM解析1

2024-09-06 09:38
文章标签 xml 解析 dom

本文主要是介绍XML-DOM解析1,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1 XML入门

              1.1 引入

                 HTML:负责网页的结构       

                 CSS:负责网页的样式(美观)

                 Javascript:负责在浏览器端与用户进行交互。

 

                 负责静态的网页制作的语言

                        

                 HTML语言特点:

                                  1)由标签组成。 <title> <p> <hr/> <br/>

                                  2)语法结构松散的    <p></p>   <p> <P>

                                          大小写不区分

                                          结束标签和开始标签不一定匹配

                                 

                                 

<html>

        <head>

                 <title>this is title</title>

        </head>

        <body>

                 <p>html标签</p>

                 <P>html标签</P>

                 <abc>abc标签</abc>  自定义标签

        </body>

</html>

 

                                 这种自定义标签可以把他们叫做xml标签

                

              1.2HTML和XML的区别  

                                  HTML                                      XML  

名称:       HyperText Markup Languae(超文本标记语言)    Extend Markup Languge(可扩展标签语言)

标签:     标签是w3c组成指定,固定的,约100来个         标签由开发者自己制定的(要按照一定的语法定                                                                                                                              义)

作用:      负责网页的结构                              1)描述带关系的数据(作为软件的配置文件): 包                                                                                                                           含与被包含的关系

                                                                                                                              properties文件: key-value

                                                                                                                                                        name=eric

                                                                                                                                                       password=123456

 

                                                                                                                                              <user>

                                                                                                                                                       <name>eric</name>

                                                                                                                                                       <password>123456</password>

                                                                                                                                              </user>

                                                                                                                              场景:

                                                                                                                                              tomcat

                                                                                                                                              struts Hibernate spring (三大框架)

                                                                                                                     2)作为数据的载体(存储数据,小型的“数据库”)

                                                                                                                             

 

2 XML作用

              2.1 描述带关系的数据(软件的配置文件

                         web服务器(PC):

                         学生管理系统 -> 添加学生功能 -> 添加学生页面 -> name=eric&email=eric@qq.com 

                                  前提:网络(IP地址: oracle:255.43.12.54  端口:1521 )

 

                                  java代码:使用ip(255.43.12.54)地址和端口(1521),连接oracle数据库,保存学生数据。

 

                                  把ip地址端口配置到xml文件:

                                                  host.xml

                                                           <host>

                                                                   <ip>255.43.12.55</ip>

                                                                   <port>1521</port>

                                                           </host>

 

                         数据库服务器(PC):

                                                  主服务器(255.43.12.54):Oracle数据库软件(负载)

                                                  副服务器(255.43.12.55):Oracle数据库软件

              2.2 数据的载体(小型的“数据库”)

                         教师管理系统:  姓名   工龄+1  邮箱

 

                         发教师数据给财务管理系统:

                                          Stringteacher =    name=张三&email=zhangsan@qq.com&workage=2  字符串

                                                           (问题: 1)不好解析 2)不是规范)

 

                                          teacher.xml

                                                  <teacher>       

                                                                   <name>张三</name>

                                                                   <email>zhangsan@qq.com</email>

                                                                   <workage>2</workage>

                                                  </teacher>

                                          这种一种规范

 

                         财务管理系统:  

                                                  姓名   工龄+1  邮箱

                                          发奖金:  统计奖金。   工龄
                                          发邮件功能:

                                                           邮箱   姓名  金额

 

                         方案一:在财务管理系统中维护了一套教师信息。

                                          每年: 工龄增加  维护了两个系统的信息。

 

                         方案二:教师信息只在教学管理系统中维护。

3 XML语法

                 xml文件以xml后缀名结尾。

                 xml文件需要使用xml解析器去解析。浏览器内置了xml解析器。

              3.1 标签

                         语法: <student></student> 开始标签  标签体内容  结束标签

                                  1)<student/> 或 <student></student>空标签。没有标签体内容

                                  2)xml标签名称区分大小写。

                                  3)xml标签一定要正确配对。

                                  4)xml标签名中间不能使用空格

                                  5)xml标签名不能以数字开头

                                 6)注意:在一个xml文档中,有且仅有一个根标签

              3.2 属性

                         语法:<Student name="eric">student</Student>

                         注意:

                                          1)属性值必须以引号包含,不能省略,也不能单双引号混用!!!

                                          2)一个标签内可以有多个属性,但不能出现重复的属性名!!!

              3.3 注释

                                          语言: <!--  xml注释 -->

 

                 练习:

                                  通讯录系统

                                  联系人数据:编号(唯一的) 姓名   年龄   电话邮箱  QQ

 

                                   要求:

                                  contact.xml

                                          1)设计一个xml文件,用于存储联系人数据

                                          2)这个xml文件可以多个联系人。

              3.4 文档声明

                 语法: <?xml version="1.0" encoding="utf-8"?>

 

                 version:xml的版本号

                 encoding:解析xml文件时查询的码表(解码过程时查询的码表)

 

                 注意:

                                  1)如果在ecplise工具中开发xml文件,保存xml文件时自动按照文档声明的encoding来保存文                                         件。

                                  2)如果用记事本工具修改xml文件,注意保存xml文件按照文档声明的encoding的码表来保存。

 

              3.5 转义字符

                 在xml中内置了一些特殊字符,这些特殊字符不能直接被浏览器原样输出。如果希望把这些特殊字符按照原样输出到浏览器,对这些特殊字符进行转义。转义之后的字符就叫转义字节。

 

                                特殊字符  转义字符

                                   <        &lt;

                                   >        &gt;

                                   "        &quot;

                                  &         &amp;

                                  空格      &nsbp;

                                 

              3.6CDATA块

                 作用:可以让一些需要进行包含特殊字符的内容统一进行原样输出。

 

              3.7 处理指令

                         作用:告诉xml解析如果解析xml文档

                        

                         案例:<?xml-stylesheet type="text/css"href="1.css"?> 告诉xml解析该xml文档引用了哪个css文件

 

                                  需要提前xml内容可以使用xml-stylesheet指令指令

                                 

       

4 XML解析 

              4.1 引入

                 xml文件除了给开发者看,更多的情况使用程序读取xml文件的内容。这叫做xml解析

              4.2 XML解析方式(原理不同)

                         DOM解析

                         SAX解析

              4.3 XML解析工具

                                  DOM解析原理:

                                                  1)JAXP (oracle-Sun公司官方)

                                                  2)JDOM工具(非官方)

                                                  3Dom4J工具(非官方)

                                                           三大框架(默认读取xml的工具就是Dom4j

                                                  .......

 

                                  SAX解析原理:

                                                  1Sax解析工具(oracle-sun公司官方)

 

              4.4 什么是DOM解析

                         DOM解析原理:xml解析器一次性把整个xml文档加载进内存,然后在内存中构建一颗Document的对象树,通过Document对象,得到树上的节点对象,通过节点对象访问(操作)到xml文档的内容。

              4.5Dom4j工具

                         非官方,不在jdk中。

 

                         使用步骤:

                                  1)导入dom4j的核心包。 dom4j-1.6.1.jar

                                  2)编写Dom4j读取xml文件代码

                                 

public static void main(String[] args) {

      try {

          //1.创建一个xml解析器对象

          SAXReader reader = new SAXReader();

          //2.读取xml文档,返回Document对象

          Document doc = reader.read(new File("./src/contact.xml"));

         

          System.out.println(doc);

      } catch (DocumentException e) {

          e.printStackTrace();

          throw new RuntimeException(e);

      }

     

   }

 

              4.6Domj4读取xml文件

                                  节点:

                                          Iterator  Element.nodeIterator();  //获取当前标签节点下的所有子节点

 

                                  标签:

                                            Element Document.getRootElement();  //获取xml文档的根标签                

                                           Element  ELement.element("标签名") //指定名称的第一个子标签

                                            Iterator<Element>Element.elementIterator("标签名");// 指定名称的所有子标签

                                                  List<Element> Element.elements(); //获取所有子标签

                                                 

                                  属性:

                                          String   Element.attributeValue("属性名") //获取指定名称的属性值

                                           Attribute   Element.attribute("属性名");//获取指定名称的属性对象   

                                                           Attribute.getName()  //获取属性名称

                                                           Attibute.getValue()  //获取属性值

                                                  List<Attribute>        Element.attributes();  //获取所有属性对象

                                                  Iterator<Attribute>          Element.attibuteIterator(); //获取所有属性对象

 

                                  文本:

                                                           Element.getText();  //获取当前标签的文本

                                                           Element.elementText("标签名") //获取当前标签的指定名称的子标签的文本内容

                                 

                 练习:

                                  把上午写的联系人的xml文件内容,使用dom4j完整地读取并打印出来。

 

 

                         总结:

                                  1)XML的作用

                                           配置文件(最常见)

                                           作为数据库

                                  2)XML语法

                                  3)XML解析(DOM解析)

                                           3.1 DOM解析原理

                                           3.2 Dom4j工具(基于DOM解析)

                                                           读取:

                                                                   节点

                                                                            标签节点

                                                                            属性节点

这篇关于XML-DOM解析1的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1141664

相关文章

深度解析Python中递归下降解析器的原理与实现

《深度解析Python中递归下降解析器的原理与实现》在编译器设计、配置文件处理和数据转换领域,递归下降解析器是最常用且最直观的解析技术,本文将详细介绍递归下降解析器的原理与实现,感兴趣的小伙伴可以跟随... 目录引言:解析器的核心价值一、递归下降解析器基础1.1 核心概念解析1.2 基本架构二、简单算术表达

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解(高频使用)三、clean生命周期核心阶

深入解析C++ 中std::map内存管理

《深入解析C++中std::map内存管理》文章详解C++std::map内存管理,指出clear()仅删除元素可能不释放底层内存,建议用swap()与空map交换以彻底释放,针对指针类型需手动de... 目录1️、基本清空std::map2️、使用 swap 彻底释放内存3️、map 中存储指针类型的对象

Java Scanner类解析与实战教程

《JavaScanner类解析与实战教程》JavaScanner类(java.util包)是文本输入解析工具,支持基本类型和字符串读取,基于Readable接口与正则分隔符实现,适用于控制台、文件输... 目录一、核心设计与工作原理1.底层依赖2.解析机制A.核心逻辑基于分隔符(delimiter)和模式匹

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

深度解析Python yfinance的核心功能和高级用法

《深度解析Pythonyfinance的核心功能和高级用法》yfinance是一个功能强大且易于使用的Python库,用于从YahooFinance获取金融数据,本教程将深入探讨yfinance的核... 目录yfinance 深度解析教程 (python)1. 简介与安装1.1 什么是 yfinance?

99%的人都选错了! 路由器WiFi双频合一还是分开好的专业解析与适用场景探讨

《99%的人都选错了!路由器WiFi双频合一还是分开好的专业解析与适用场景探讨》关于双频路由器的“双频合一”与“分开使用”两种模式,用户往往存在诸多疑问,本文将从多个维度深入探讨这两种模式的优缺点,... 在如今“没有WiFi就等于与世隔绝”的时代,越来越多家庭、办公室都开始配置双频无线路由器。但你有没有注