SAX 解析到文件,缓存到内存

2024-04-01 21:58
文章标签 内存 解析 缓存 sax

本文主要是介绍SAX 解析到文件,缓存到内存,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

目的
    通过一个小的SAX例子,我们更清晰的理解SAX的工作原理。

    本文例子主要实现:
    1. 将每个Employee信息输出到自己的文件中,文件名是以Employee ID和Employee Name来命名的,注意,观察代码中是如何得到Employee ID和Employee Name;
    2. 将每个Employee信息存入到Map中,其中,Map中的每个Value对应一个Employee的Collection,Map中的每个Key对应该Employee的ID。


    package shuai.study.sax.demo;  import java.io.File;  import java.io.IOException;  import java.util.Collection;  import java.util.HashMap;  import java.util.LinkedList;  import java.util.Map;  import javax.xml.parsers.ParserConfigurationException;  import javax.xml.parsers.SAXParser;  import javax.xml.parsers.SAXParserFactory;  import org.apache.commons.io.FileUtils;  import org.apache.commons.lang3.StringUtils;  import org.xml.sax.Attributes;  import org.xml.sax.SAXException;  import org.xml.sax.helpers.DefaultHandler;  /** * @author shengshu *  */  public class SaxHandler extends DefaultHandler {  private final static String leafNodeText = "|firstname|;|lastname|;|sex|;|country|;|province|;|city|;|village|;|mobile|;|mail|;|qq|;|postcode|;|profession|";  private Map<String, Collection<String>> companyMap = null;  private Collection<String> employeeCollection = null;  private String currentValue = null;  private String currentCharacters = null;  private StringBuffer idAndNameStringBuffer = null;  public SaxHandler(File inputFile) {  this.parseDocument(inputFile);  }  private void parseDocument(File inputFile) {  SAXParserFactory saxParserFactory = SAXParserFactory.newInstance();  try {  SAXParser saxParser = saxParserFactory.newSAXParser();  saxParser.parse(inputFile, this);  } catch (ParserConfigurationException pce) {  pce.printStackTrace();  } catch (SAXException saxe) {  saxe.printStackTrace();  } catch (IOException ioe) {  ioe.printStackTrace();  }  }  @Override  public void startDocument() throws SAXException {  super.startDocument();  this.companyMap = new HashMap<String, Collection<String>>();  }  @Override  public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {  if (qName.equalsIgnoreCase("Employee")) {  this.employeeCollection = new LinkedList<String>();  this.idAndNameStringBuffer = new StringBuffer();  this.currentValue = attributes.getValue("ID");  }  }  @Override  public void characters(char[] buffer, int start, int length) {  this.currentCharacters = new String(buffer, start, length);  }  @Override  public void endElement(String uri, String localName, String qName) throws SAXException {  if (StringUtils.containsIgnoreCase(leafNodeText, "|" + qName + "|")) {  this.employeeCollection.add(qName + ": " + this.currentCharacters);  if (qName.equalsIgnoreCase("FirstName")) {  this.idAndNameStringBuffer.append(this.currentCharacters);  }  if (qName.equalsIgnoreCase("LastName")) {  this.idAndNameStringBuffer.append(this.currentCharacters);  }  }  if (qName.equalsIgnoreCase("Employee")) {  this.companyMap.put(this.currentValue, this.employeeCollection);  this.idAndNameStringBuffer.append("-").append(this.currentValue);  this.writeEmployee(employeeCollection, idAndNameStringBuffer.toString());  }  }  private void writeEmployee(Collection<String> employeeCollection, String fileName) {  String outputFileDirectory = SaxHandler.class.getResource("/file/output/").getPath();  String outputFilePath = outputFileDirectory + fileName + ".xml";  File outputFile = new File(outputFilePath);  try {  FileUtils.writeLines(outputFile, employeeCollection, false);  } catch (IOException ioe) {  ioe.printStackTrace();  }  }  @Override  public void endDocument() throws SAXException {  super.endDocument();  }  public Map<String, Collection<String>> getCompanyMap() {  return this.companyMap;  }  }  

    package shuai.study.sax.demo;  import java.io.File;  import java.util.Collection;  import java.util.Iterator;  import java.util.Map;  import java.util.Map.Entry;  /** * @author shengshu *  */  public class SaxDemo {  public static void displayCompany(Map<String, Collection<String>> companyMap) {  Iterator<Entry<String, Collection<String>>> companyIterator = companyMap.entrySet().iterator();  while (companyIterator.hasNext()) {  Entry<String, Collection<String>> companyEntry = companyIterator.next();  String id = companyEntry.getKey();  System.out.println("============== Employee ID " + id + " Start ==============");  Collection<String> employeeCollection = companyEntry.getValue();  Iterator<String> employeeIterator = employeeCollection.iterator();  while (employeeIterator.hasNext()) {  String leafNodeAndValue = employeeIterator.next();  System.out.println(leafNodeAndValue);  }  System.out.println("============== Employee ID " + id + " End ==============");  }  }  public static void main(String[] args) {  String inputFilePath = SaxDemo.class.getResource("/file/input/company.xml").getPath();  File inputFile = new File(inputFilePath);  SaxHandler saxHandler = new SaxHandler(inputFile);  Map<String, Collection<String>> companyMap = saxHandler.getCompanyMap();  SaxDemo.displayCompany(companyMap);  }  }  

    <?xml version = "1.0" encoding="UTF-8"?>  <Company>  <Employee ID="37">  <Name>  <FirstName>Zhou</FirstName>  <LastName>Shengshuai</LastName>  </Name>  <Sex>Male</Sex>  <Address>  <Country>China</Country>  <Province>ShanDong</Province>  <City>LinYi</City>  <Village>FengHuangYu</Village>  <Contact>  <Mobile>18108***778</Mobile>  <Mail>zhoushengshuai2007@163.com</Mail>  <QQ>254392398</QQ>  <Postcode>276422</Postcode>  </Contact>  </Address>  <Profession>Software</Profession>  </Employee>  <Employee ID="66">  <Name>  <FirstName>Wang</FirstName>  <LastName>Eric</LastName>  </Name>  <Sex>Male</Sex>  <Address>  <Country>China</Country>  <Province>HeBei</Province>  <City>QinHuangDao</City>  <Village>hhh</Village>  <Contact>  <Mobile>150*****955</Mobile>  <Mail>eric@163.com</Mail>  <QQ>666666666</QQ>  <Postcode>111666</Postcode>  </Contact>  </Address>  <Profession>Software</Profession>  </Employee>  <Employee ID="99">  <Name>  <FirstName>Shi</FirstName>  <LastName>Stone</LastName>  </Name>  <Sex>Male</Sex>  <Address>  <Country>China</Country>  <Province>HeNan</Province>  <City>PingDingShan</City>  <Village>nnn</Village>  <Contact>  <Mobile>186*****015</Mobile>  <Mail>stone@163.com</Mail>  <QQ>999999999</QQ>  <Postcode>111999</Postcode>  </Contact>  </Address>  <Profession>Software</Profession>  </Employee>  </Company>  

这篇关于SAX 解析到文件,缓存到内存的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/868234

相关文章

深度解析Java @Serial 注解及常见错误案例

《深度解析Java@Serial注解及常见错误案例》Java14引入@Serial注解,用于编译时校验序列化成员,替代传统方式解决运行时错误,适用于Serializable类的方法/字段,需注意签... 目录Java @Serial 注解深度解析1. 注解本质2. 核心作用(1) 主要用途(2) 适用位置3

Java MCP 的鉴权深度解析

《JavaMCP的鉴权深度解析》文章介绍JavaMCP鉴权的实现方式,指出客户端可通过queryString、header或env传递鉴权信息,服务器端支持工具单独鉴权、过滤器集中鉴权及启动时鉴权... 目录一、MCP Client 侧(负责传递,比较简单)(1)常见的 mcpServers json 配置

Redis实现高效内存管理的示例代码

《Redis实现高效内存管理的示例代码》Redis内存管理是其核心功能之一,为了高效地利用内存,Redis采用了多种技术和策略,如优化的数据结构、内存分配策略、内存回收、数据压缩等,下面就来详细的介绍... 目录1. 内存分配策略jemalloc 的使用2. 数据压缩和编码ziplist示例代码3. 优化的

从原理到实战解析Java Stream 的并行流性能优化

《从原理到实战解析JavaStream的并行流性能优化》本文给大家介绍JavaStream的并行流性能优化:从原理到实战的全攻略,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的... 目录一、并行流的核心原理与适用场景二、性能优化的核心策略1. 合理设置并行度:打破默认阈值2. 避免装箱

Maven中生命周期深度解析与实战指南

《Maven中生命周期深度解析与实战指南》这篇文章主要为大家详细介绍了Maven生命周期实战指南,包含核心概念、阶段详解、SpringBoot特化场景及企业级实践建议,希望对大家有一定的帮助... 目录一、Maven 生命周期哲学二、default生命周期核心阶段详解(高频使用)三、clean生命周期核心阶

深入解析C++ 中std::map内存管理

《深入解析C++中std::map内存管理》文章详解C++std::map内存管理,指出clear()仅删除元素可能不释放底层内存,建议用swap()与空map交换以彻底释放,针对指针类型需手动de... 目录1️、基本清空std::map2️、使用 swap 彻底释放内存3️、map 中存储指针类型的对象

Java Scanner类解析与实战教程

《JavaScanner类解析与实战教程》JavaScanner类(java.util包)是文本输入解析工具,支持基本类型和字符串读取,基于Readable接口与正则分隔符实现,适用于控制台、文件输... 目录一、核心设计与工作原理1.底层依赖2.解析机制A.核心逻辑基于分隔符(delimiter)和模式匹

Java+AI驱动实现PDF文件数据提取与解析

《Java+AI驱动实现PDF文件数据提取与解析》本文将和大家分享一套基于AI的体检报告智能评估方案,详细介绍从PDF上传、内容提取到AI分析、数据存储的全流程自动化实现方法,感兴趣的可以了解下... 目录一、核心流程:从上传到评估的完整链路二、第一步:解析 PDF,提取体检报告内容1. 引入依赖2. 封装

使用Spring Cache本地缓存示例代码

《使用SpringCache本地缓存示例代码》缓存是提高应用程序性能的重要手段,通过将频繁访问的数据存储在内存中,可以减少数据库访问次数,从而加速数据读取,:本文主要介绍使用SpringCac... 目录一、Spring Cache简介核心特点:二、基础配置1. 添加依赖2. 启用缓存3. 缓存配置方案方案

Python内存优化的实战技巧分享

《Python内存优化的实战技巧分享》Python作为一门解释型语言,虽然在开发效率上有着显著优势,但在执行效率方面往往被诟病,然而,通过合理的内存优化策略,我们可以让Python程序的运行速度提升3... 目录前言python内存管理机制引用计数机制垃圾回收机制内存泄漏的常见原因1. 循环引用2. 全局变