python 使用 xml.etree.ElementTree 解析 xml

2023-10-04 00:01

本文主要是介绍python 使用 xml.etree.ElementTree 解析 xml,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

使用 xml.etree.ElementTree  (简称ET) 来解析 xml  非常好用推荐给大家。按照我自己的理解,使用ET 解析xml 就像 遍历 字典一样 ,以如下数据为例

<?xml version="1.0" encoding="utf-8"?><SMP2019-ECISA><Doc ID="4"><Sentence ID="1" label="2">转发了财新网的微博:【内鬼与大鳄姚刚张育军的唏嘘人生】(记者刘彩萍)近日,中国证券监督管理委员会原党委委员、副主席姚刚和原党委委员、主席助理张育军被查。</Sentence><Sentence ID="2">两位高级干部先后被双开并移交司法引发资本市场无限唏嘘,曾经的后备干部、创新先锋倒在了利益面前。</Sentence><Sentence ID="3">内鬼与大鳄姚刚张育军的唏嘘人生??</Sentence><Sentence ID="4">原图?</Sentence><Sentence ID="5">赞[21]?</Sentence><Sentence ID="6">原文转发[29]?</Sentence><Sentence ID="7">原文评论[52]转发理由:副主席,江湖上称发审皇帝,IPO审批制的坚决拥护者。</Sentence><Sentence ID="8">攀附山西王成,让一大批乐视这种垃圾公司上市,权?</Sentence><Sentence ID="9">贵牛的中枢。</Sentence><Sentence ID="10">人民牛,还缺一个市场化IPO,还多一个发审委。</Sentence></Doc>
</SMP2019-ECISA>

具体代码如下

import xml.etree.ElementTree as ETin_file = 'SMP2019_ECISA_Dev.xml'
tree = ET.parse(in_file)
# 获得根节点 SMP2019-ECISA
root = tree.getroot()
# 遍历根节点
for doc in root:# attrib 获得 doc 的属性doc_attr = doc.attrib print(doc_attr) # {'ID': '4'}# 遍历doc 中的子元素for sent in doc:sent_attr = sent.attribprint(sent_attr) # {'ID': '1', 'label': '2'}# 获得正文text = sent.textprint(text) #转发了财新网的微博:【内鬼与大鳄姚刚张育军的唏嘘人生】...

解析过程 非常简单,主要是三个点

  1. 直接使用 in 一层一层 遍历
  2. element.attrib 获得 对应元素的属性
  3. element.text 获得正文

 

这篇关于python 使用 xml.etree.ElementTree 解析 xml的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/934

相关文章

Python实现批量CSV转Excel的高性能处理方案

《Python实现批量CSV转Excel的高性能处理方案》在日常办公中,我们经常需要将CSV格式的数据转换为Excel文件,本文将介绍一个基于Python的高性能解决方案,感兴趣的小伙伴可以跟随小编一... 目录一、场景需求二、技术方案三、核心代码四、批量处理方案五、性能优化六、使用示例完整代码七、小结一、

Python中 try / except / else / finally 异常处理方法详解

《Python中try/except/else/finally异常处理方法详解》:本文主要介绍Python中try/except/else/finally异常处理方法的相关资料,涵... 目录1. 基本结构2. 各部分的作用tryexceptelsefinally3. 执行流程总结4. 常见用法(1)多个e

Java使用jar命令配置服务器端口的完整指南

《Java使用jar命令配置服务器端口的完整指南》本文将详细介绍如何使用java-jar命令启动应用,并重点讲解如何配置服务器端口,同时提供一个实用的Web工具来简化这一过程,希望对大家有所帮助... 目录1. Java Jar文件简介1.1 什么是Jar文件1.2 创建可执行Jar文件2. 使用java

C#使用Spire.Doc for .NET实现HTML转Word的高效方案

《C#使用Spire.Docfor.NET实现HTML转Word的高效方案》在Web开发中,HTML内容的生成与处理是高频需求,然而,当用户需要将HTML页面或动态生成的HTML字符串转换为Wor... 目录引言一、html转Word的典型场景与挑战二、用 Spire.Doc 实现 HTML 转 Word1

Python中logging模块用法示例总结

《Python中logging模块用法示例总结》在Python中logging模块是一个强大的日志记录工具,它允许用户将程序运行期间产生的日志信息输出到控制台或者写入到文件中,:本文主要介绍Pyt... 目录前言一. 基本使用1. 五种日志等级2.  设置报告等级3. 自定义格式4. C语言风格的格式化方法

Python实现精确小数计算的完全指南

《Python实现精确小数计算的完全指南》在金融计算、科学实验和工程领域,浮点数精度问题一直是开发者面临的重大挑战,本文将深入解析Python精确小数计算技术体系,感兴趣的小伙伴可以了解一下... 目录引言:小数精度问题的核心挑战一、浮点数精度问题分析1.1 浮点数精度陷阱1.2 浮点数误差来源二、基础解决

Java中的抽象类与abstract 关键字使用详解

《Java中的抽象类与abstract关键字使用详解》:本文主要介绍Java中的抽象类与abstract关键字使用详解,本文通过实例代码给大家介绍的非常详细,感兴趣的朋友跟随小编一起看看吧... 目录一、抽象类的概念二、使用 abstract2.1 修饰类 => 抽象类2.2 修饰方法 => 抽象方法,没有

MyBatis ParameterHandler的具体使用

《MyBatisParameterHandler的具体使用》本文主要介绍了MyBatisParameterHandler的具体使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参... 目录一、概述二、源码1 关键属性2.setParameters3.TypeHandler1.TypeHa

Spring 中的切面与事务结合使用完整示例

《Spring中的切面与事务结合使用完整示例》本文给大家介绍Spring中的切面与事务结合使用完整示例,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友参考... 目录 一、前置知识:Spring AOP 与 事务的关系 事务本质上就是一个“切面”二、核心组件三、完

使用docker搭建嵌入式Linux开发环境

《使用docker搭建嵌入式Linux开发环境》本文主要介绍了使用docker搭建嵌入式Linux开发环境,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面... 目录1、前言2、安装docker3、编写容器管理脚本4、创建容器1、前言在日常开发全志、rk等不同