XML-DOM解析

2024-09-06 09:38
文章标签 xml 解析 dom

本文主要是介绍XML-DOM解析,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

    1 什么是XML

       XML(eXtensibleMarkup Language,可扩展标记语言)。

        1.1数据、文件和文本

                1.1.1二进制文件

       我们称插入到文档中的代码为元数据,或者关于信息的信息,正是这些元数据,使得一种文件类型有别于另一种文件类型。二进制格式文件有诸多优点:计算机容易理解、处理速度快、存储效率高。

                1.1.2 文本文件

       与二进制文件一样,文本文件也是比特流,但是与二进制不同的是,文本文件里的比特流是以一种标准格式组织起来的。因此它们总是组成一个数,每个数再映射成字符。

例如:

       1100001->97->a

                1.1.3 标记语言

       我们希望把二进制的存储效率与文本文件的丰富的存储格式相结合。

        1.2什么是XML

       虽然HTML取得了令人难以置信的成功,但是它的应用范围受到限制。它只适用于游览器里显示文档。XML规定了某个语法,我们可以利用这个语法创建自己的语言。

       例子: 假设读者有一个数据表示某人的姓名

       最好不要采用的方式

      

<html>

 <head><title></title></head>

 <body>

   <p>John doe</p>

 </body>

</html>

       而是采用这样的格式:

      

<name>

  <first>John</first>

  <last>Doe<last>

<name>

       可以看出XML使得数据结构化。

                1.2.1 XML能给我们带来什么好处

                   1.XML解析器

       根据XML的规则,我们很容易获取所需要的数据。这是因为存在一些称之为解析器的程序可以理解XML语法并为我们读取信息。

                   2.为什么是可扩展的

       因为任何人可以按任何方式用XML语言标记数据,即使其他人可以按完全不同的方式标记数据。

                1.2.2 HTML与XML

       HTML用于信息显示,XML用于信息交换。本质的区别在于:HTML是为某个专用的应用程序设计的,它把信息传递给人们(通常通过一个Web游览器),而XML不是为某个专用的应用程序设计的,它可以用于任何我们想用它的情形。

                1.2.3信息的层级结构

       软件开发人员采用了一个称为对象模型的结构。根据对象模型,模型中所有的信息可以分解为多个对象,每个对象本身又可以分解为一个层级结构。


        关于XML的解析方式,这里主要介绍的是DOM 解析, 关于DOM,学过HTML应该都不陌生了吧,DOM(document object model),也就是所谓的文档对象模型,XML中的标签,文本,属性等都被解析为一个节点,分为标签节点,文本节点,属性节点等,这些节点因为其

相互的关系,构成了一棵树模型,DOM解析通过读取树模型中的节点对象进而获取相关的信息。
下面为实例:
这是XML,记录联系人的信息
<contacts><contact ><id>1</id><name>您好</name><age>17</age></contact><contact ><id>2</id><name>Hello</name><age>18</age></contact>
</contacts>
这是类Contact
package util;public class Contact {private String id;private String name;private String age;public String getId() {return id;}public void setId(String id) {this.id = id;}public String getName() {return name;}public void setName(String name) {this.name = name;}public String getAge() {return age;}public void setAge(String age) {this.age = age;}@Overridepublic String toString() {// TODO Auto-generated method stubreturn this.id+" | " + this.name + " | " + this.age;}}
这是核心功能函数, 读取XML中的内容,然后把XML的数据封装成我们编程需要的Contact对象。
注意,这里需要导入dom4j的包,然后调用其提供的方法。
package util;import java.io.File;
import java.util.ArrayList;
import java.util.Iterator;
import java.util.List;import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentException;
import org.dom4j.Element;
import org.dom4j.Node;
import org.dom4j.Text;
import org.dom4j.io.SAXReader;
import org.junit.Test;
/*** 把XML的文件信息封装到对象中* @author Neuclil**/
public class ReadXML {public static void main(String[] args) throws DocumentException {List<Contact> contacts = new ArrayList<Contact>();readXMl(contacts);Iterator<Contact> iterator = contacts.iterator();while(iterator.hasNext()){System.out.println(iterator.next().toString());}}public static void readXMl(List<Contact> lists) throws DocumentException{SAXReader saxReader = new SAXReader();Document doc = saxReader.read(new File("./src/contact.xml"));Element rootElement = doc.getRootElement();List<Element> elements = rootElement.elements("contact");Iterator<Element> iterator = elements.iterator();while(iterator.hasNext()){Element element = iterator.next();Contact contact = new Contact();contact.setId(element.elementText("id"));contact.setName(element.elementText("name"));contact.setAge(element.elementText("age"));lists.add(contact);}}
}




这篇关于XML-DOM解析的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1141663

相关文章

Java中Redisson 的原理深度解析

《Java中Redisson的原理深度解析》Redisson是一个高性能的Redis客户端,它通过将Redis数据结构映射为Java对象和分布式对象,实现了在Java应用中方便地使用Redis,本文... 目录前言一、核心设计理念二、核心架构与通信层1. 基于 Netty 的异步非阻塞通信2. 编解码器三、

MyBatis常用XML语法详解

《MyBatis常用XML语法详解》文章介绍了MyBatis常用XML语法,包括结果映射、查询语句、插入语句、更新语句、删除语句、动态SQL标签以及ehcache.xml文件的使用,感兴趣的朋友跟随小... 目录1、定义结果映射2、查询语句3、插入语句4、更新语句5、删除语句6、动态 SQL 标签7、ehc

Java HashMap的底层实现原理深度解析

《JavaHashMap的底层实现原理深度解析》HashMap基于数组+链表+红黑树结构,通过哈希算法和扩容机制优化性能,负载因子与树化阈值平衡效率,是Java开发必备的高效数据结构,本文给大家介绍... 目录一、概述:HashMap的宏观结构二、核心数据结构解析1. 数组(桶数组)2. 链表节点(Node

Java 虚拟线程的创建与使用深度解析

《Java虚拟线程的创建与使用深度解析》虚拟线程是Java19中以预览特性形式引入,Java21起正式发布的轻量级线程,本文给大家介绍Java虚拟线程的创建与使用,感兴趣的朋友一起看看吧... 目录一、虚拟线程简介1.1 什么是虚拟线程?1.2 为什么需要虚拟线程?二、虚拟线程与平台线程对比代码对比示例:三

一文解析C#中的StringSplitOptions枚举

《一文解析C#中的StringSplitOptions枚举》StringSplitOptions是C#中的一个枚举类型,用于控制string.Split()方法分割字符串时的行为,核心作用是处理分割后... 目录C#的StringSplitOptions枚举1.StringSplitOptions枚举的常用

Python函数作用域与闭包举例深度解析

《Python函数作用域与闭包举例深度解析》Python函数的作用域规则和闭包是编程中的关键概念,它们决定了变量的访问和生命周期,:本文主要介绍Python函数作用域与闭包的相关资料,文中通过代码... 目录1. 基础作用域访问示例1:访问全局变量示例2:访问外层函数变量2. 闭包基础示例3:简单闭包示例4

MyBatis延迟加载与多级缓存全解析

《MyBatis延迟加载与多级缓存全解析》文章介绍MyBatis的延迟加载与多级缓存机制,延迟加载按需加载关联数据提升性能,一级缓存会话级默认开启,二级缓存工厂级支持跨会话共享,增删改操作会清空对应缓... 目录MyBATis延迟加载策略一对多示例一对多示例MyBatis框架的缓存一级缓存二级缓存MyBat

前端缓存策略的自解方案全解析

《前端缓存策略的自解方案全解析》缓存从来都是前端的一个痛点,很多前端搞不清楚缓存到底是何物,:本文主要介绍前端缓存的自解方案,文中通过代码介绍的非常详细,需要的朋友可以参考下... 目录一、为什么“清缓存”成了技术圈的梗二、先给缓存“把个脉”:浏览器到底缓存了谁?三、设计思路:把“发版”做成“自愈”四、代码

Java集合之Iterator迭代器实现代码解析

《Java集合之Iterator迭代器实现代码解析》迭代器Iterator是Java集合框架中的一个核心接口,位于java.util包下,它定义了一种标准的元素访问机制,为各种集合类型提供了一种统一的... 目录一、什么是Iterator二、Iterator的核心方法三、基本使用示例四、Iterator的工

Java JDK Validation 注解解析与使用方法验证

《JavaJDKValidation注解解析与使用方法验证》JakartaValidation提供了一种声明式、标准化的方式来验证Java对象,与框架无关,可以方便地集成到各种Java应用中,... 目录核心概念1. 主要注解基本约束注解其他常用注解2. 核心接口使用方法1. 基本使用添加依赖 (Maven