解析xml的底层接口:一种是dom,一种是sax。

  DOM与SAX的区别。

  DMO:dom解析xml时,首先是将xml文档的内容整个加载到内存中,并解析成树形结构。然后开始随机访问内存中的对橡树。所以当xml文件比较大的时候,效率就会降低,还可能发生内存溢出。

  SAX:是基于事件而且是顺序解析,不会一次性将内容解析完。而是读到什么标签时,调用相应的方法去解析。缺点就是不可逆,一个元素错过之后就没法返回再次解析。但是由于不会事先将内容加载到内存中所以对内存的占用非常小。虽然SAX在开发上比dom要稍微复杂点,需要开发者自己实现事件处理器,但是也正是应为交由开发者自己处理也将变得更加灵活。

DOM

public class Demo {public static void main(String[] args) throws Exception {          //获得一个从xml文档生成dom对象的一个解析器DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();                    //创建dom实例的APIDocumentBuilder db = dbf.newDocumentBuilder();          //将给定的文件解析成xml文档,并返回一个新的dom对象Document doc = db.parse(new File("dubbo.xml"));//输出文档属性,并返回成一个元素集合点实例Element eoc = doc.getDocumentElement();parseElement(eoc);}private static void parseElement(Element element) {//输出元素集合中第一个节点的节点名String name = element.getNodeName();System.out.println("<" + name);//输出节点属性,返回一个map实例NamedNodeMap map = element.getAttributes();if (null != map) {//输出节点属性中 每个属性的name与valuefor (int i = 0; i < map.getLength(); i++) {Attr attr = (Attr)map.item(i);String attrName = attr.getName();String attrValue = attr.getValue();System.out.println("" + attrName + "=\""+attrValue+"\"");}}System.out.println(">");//getChildNodes 返回当前节点下所有的子节点,而dom默认认为换行也是一个节点。所以会出现#test这样的输出(换行导致)NodeList child = element.getChildNodes();for (int i = 0; i < child.getLength(); i++) {Node node = child.item(i);//TEXT_NODE-文字节点类型//DOCUMENT_NODE-文本节点类型//COMMENT_NODE-注释节点类型//ATTRIBUTE_NODE-属性节点类型//ELEMENT_NODE-元素节点类型Short noteType = node.getNodeType();if (noteType == Node.ELEMENT_NODE) {parseElement((Element)node);} else {if (noteType == Node.TEXT_NODE) {System.out.println(node.getTextContent());} else {if (noteType == Node.COMMENT_NODE) {System.out.println("<!--"+node.getTextContent() + "-->");}}}}System.out.println("</" +name+ ">");}
}

SAX

public class SAXHandler extends DefaultHandler{private String currentElement;private String currentValue;private String attrName;private String attrValue;@Overridepublic void startElement(String uri, String localName,String qName, Attributes attributes) {currentElement = qName;for (int i = 0; i < attributes.getLength(); i++) {attrName = attributes.getQName(i);attrValue = attributes.getValue(i);System.out.println("属性:" + attrName + "=" + attrValue);}}@Overridepublic void characters(char[] ch, int start, int length)throws SAXException {currentValue = new String(ch,start,length);System.out.println("characters开始" + currentValue);}@Overridepublic void endElement(String uri, String localName, String qName) {if (currentElement.equals(qName)) {System.out.println(currentElement + "=" + currentValue);}}
}public static void main(String[] args) throws Exception {SAXParserFactory spf = SAXParserFactory.newInstance();SAXParser sp = spf.newSAXParser();SAXHandler handler = new SAXHandler();sp.parse(new File("dubbo.xml"), handler);}

  

而jdom和dom4j则是针对底层接口的延伸,且这2个接口都只是面向java语言。

jdom

dom4j

上诉这3个方式都封装好了对xml文件的操作功能,而且基本的方法都大同小异。

由于jdom对于大型的xml文件存在内存溢出的问题,所以现在市面上比较流行的是dom4j的方式来操作。

但实际上dom4j最早只是一个jdom的延伸,当初jdom由于是针对实现变成,灵活性不足,所以才有了后来的dom4j。

转载于:https://www.cnblogs.com/culushitai/p/8534110.html

针对xml文件做提取与写入的操作相关推荐

  1. python下最全的cv2图像处理入门知识!!!!灰度图 RGB图 针对某种颜色做提取、高斯模糊等等

    早些时候实验的关于图像的知识,一直放着感觉发挥不出它的作用,故自己将它发上来,大家可以看看. 1.头文件 import cv2 import numpy from scipy.misc import ...

  2. java对xml文件做增删改查------摘录

    java对xml文件做增删改查 package com.wss; import java.io.File; import java.util.ArrayList; import java.util.L ...

  3. .NET 3.5(14) - XLINQ(LINQ to XML)之针对XML文件的添加、查询、更新和删除

    步步为营VS 2008 + .NET 3.5(14) - XLINQ(LINQ to XML)之针对XML文件的添加.查询.更新和删除 作者:webabcd 介绍 以某一XML文件为例,XLINQ(L ...

  4. asp.net 对xml文件的读写,添加,修改,删除操作

    asp.net 对xml文件的读写,添加,修改,删除操作 下面有代码调试正确 using System; using System.Collections; using System.Componen ...

  5. XML文件转换成字符串互相转换操作

    System.Xml.XmlDocument doc = new System.Xml.XmlDocument();//新建对象 doc.Load("filePath");//XM ...

  6. 用“XML解析开发包Jaxp”对XML文件进行Dom方式的CRUD操作

    IT程序员开发必备-各类资源下载清单,史上最全IT资源,个人收藏总结! package edu.jaxp; import java.io.FileNotFoundException; import j ...

  7. Java读取Excel文件并将之写入数据库操作

    一.添加需要的包依赖 <!--读取excel文件所需要的包--> <dependency><groupId>org.apache.poi</groupId&g ...

  8. 利用matlab对xml文件进行批量处理

    本文为原创作品,未经本人同意,禁止转载,禁止用于商业用途!本人对博客使用拥有最终解释权 欢迎关注我的博客:http://blog.csdn.net/hit2015spring和http://www.c ...

  9. XML文件处理——XML文件简介

    SAR成像处理软件经常使用XML文件进行参数传递,这里简单介绍一下XML文件.然后下面以代码段的形式分别介绍PugiXML和tinyXML两种工具对XML文件读写改查增删等操作. XML:可扩展标记语 ...

最新文章

  1. 技术19期:1分钟入门数据治理!必看!【技术篇】
  2. 服务器报错您的主机中的软件中止了一个已建立的连接
  3. 【机器学习基础】机器学习中的特征工程总结!
  4. NullPointerException int java.util.List.size()
  5. [USACO19JAN,Platinum]Train Tracking 2
  6. GC Blocks Lost等待事件
  7. python中cmd全称_【转】Python中执行cmd的三种方式
  8. Java中的equals() 和 ==
  9. Bailian1833 POJ1833 排列【全排列】
  10. VB基础知识之Do...Loop循环
  11. STKX组件技术在星地链路中的仿真模式研究
  12. 序列的傅里叶变换MATLAB实现
  13. 计算机辅助 高等数学教学,高等数学教学方法
  14. 新学两个新汇编指令:bic和orr
  15. WINDOWS备份与恢复
  16. php微信公众号样式模板下载,PHP微信公众平台自定义菜单
  17. ALEXA中国网站排名真相调查[内幕调查:出卖Alexa]
  18. 电子病历系统源码 winform 医院电子病历系统源码
  19. 什么是悲观锁和乐观锁,及分布式锁的实现方式
  20. Python中使用遍历在列表中添加字典的坑

热门文章

  1. mysql 中文排序_mysql如何按照中文排序解决方案
  2. neo4j docker
  3. C语言 指针与数组
  4. 3.10 触发字检测
  5. D3 svg text标签控制
  6. C语言 指针与结构体
  7. 数据算法之二叉树删除(BinaryTreeL Remove)的Java实现
  8. oracle使用连接池,使用Oracle的数据连接池
  9. VMWare NSX安全生产和DMZ用例的详细设计指南
  10. 在微软5年,我学到的几个小技能