XML解析总结

前端之家收集整理的这篇文章主要介绍了XML解析总结前端之家小编觉得挺不错的,现在分享给大家,也给大家做个参考。
@H_301_0@XML解析方式分为两种:DOM方式和SAX方式

@H_301_0@DOM:Document Object Model,文档对象模型。这种方式是W3C推荐的处理XML的一种方式。

@H_301_0@SAX:Simple API for XML。这种方式不是官方标准,属于开源社区XML-DEV,几乎所有的XML解析器都支持它。

@H_301_0@XML解析开发包

@H_301_0@JAXP:是SUN公司推出的解析标准实现。

@H_301_0@Dom4J:是开源组织推出的解析开发包。

@H_301_0@JDom:是开源组织推出的解析开发包。

@H_301_0@PullParser

@H_301_0@JAXP:(Java API for XML Processing)开发包是JavaSE的一部分,它由以下几个包及其子包组成:

@H_301_0@org.w3c.dom:提供DOM方式解析XML的标准接口

@H_301_0@org.xml.sax:提供SAX方式解析XML的标准接口

@H_301_0@javax.xml:提供了解析XML文档的类

@H_301_0@javax.xml.parsers包中,定义了几个工厂类(DocumentBuilderFactory 、SAXParserFactory)。我们可以通过调用这些工厂类,得到对XML文档进行解析的DOM和SAX解析器对象。

@H_301_0@使用JAXP进行DOM解析

@H_301_0@javax.xml.parsers 包中的DocumentBuilderFactory用于创建DOM模式的解析器对象 , DocumentBuilderFactory是一个抽象工厂类,它不能直接实例化,但该类提供了一个newInstance方法 ,这个方法会根据本地平台默认安装的解析器,自动创建一个工厂的对象并返回。

@H_301_0@1) 调用 DocumentBuilderFactory.newInstance() 方法得到创建 DOM 解析器的工厂。

@H_301_0@2) 调用工厂对象的 newDocumentBuilder方法得到 DOM 解析器对象。

@H_301_0@3) 调用 DOM 解析器对象的 parse() 方法解析 XML 文档,得到代表整个文档的 Document 对象,进而可以利用DOM特性对整个XML文档进行操作了

@H_301_0@DOM模型(document object model)

@H_301_0@a) DOM解析器在解析XML文档时,会把文档中的所有元素,按照其出现的层次关系,解析成一个个Node对象(节点)。

@H_301_0@b) 在dom中,节点之间关系如下:

@H_301_0@1) 位于一个节点之上的节点是该节点的父节点(parent)

@H_301_0@2) 一个节点之下的节点是该节点的子节点(children)

@H_301_0@3) 同一层次,具有相同父节点的节点是兄弟节点(sibling)

@H_301_0@4) 一个节点的下一个层次的节点集合是节点后代(descendant)

@H_301_0@5) 父、祖父节点及所有位于节点上面的,都是节点的祖先(ancestor)

@H_301_0@c) 节点类型

@H_301_0@Node对象提供了一系列常量来代表结点的类型,当开发人员获得某个Node类型后,就可以把Node节点转换成相应的节点对象(Node的子类对象),以便于调用其特有的方法。(查看API文档)

@H_301_0@Node对象提供了相应的方法去获得它的父结点或子结点。编程人员通过这些方法就可以读取整个XML文档的内容、或添加修改删除XML文档的内容了。

@H_301_0@更新XML文档

@H_301_0@javax.xml.transform包中的Transformer类用于把代表XML文件的Document对象转换为某种格式后进行输出,例如把xml文件应用样式表后转成一个html文档。利用这个对象,当然也可以把Document对象又重新写入到一个XML文件中。

@H_301_0@Transformer类通过transform方法完成转换操作,该方法接收一个源和一个目的地。我们可以通过:

@H_301_0@1) javax.xml.transform.dom.DOMSource类来关联要转换的document对象,

@H_301_0@2) 用javax.xml.transform.stream.StreamResult 对象来表示数据的目的地。

@H_301_0@Transformer对象通过TransformerFactory获得。

@H_301_0@DOM解析代码实例

  1. import java.util.ArrayList;
  2. import java.util.List;
  3.  
  4. import javax.xml.parsers.DocumentBuilder;
  5. import javax.xml.parsers.DocumentBuilderFactory;
  6. import javax.xml.transform.Transformer;
  7. import javax.xml.transform.TransformerFactory;
  8. import javax.xml.transform.dom.DOMSource;
  9. import javax.xml.transform.stream.StreamResult;
  10.  
  11. import org.w3c.dom.Document;
  12. import org.w3c.dom.Element;
  13. import org.w3c.dom.Node;
  14. import org.w3c.dom.NodeList;
  15.  
  16. import com.itheima.domain.Book;
  17.  
  18. public class DOMUtil {
  19.  
  20. public static List<Book> getBooks(String uri) throws Exception {
  21.  
  22. List<Book> books = new ArrayList<Book>();
  23. // 1. 通过DocumentBuilderFactory 创建一个工厂类
  24. DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
  25. // 2. 通过工厂的newDocumnentBuilder方法获取一个DocumentBuilder
  26. DocumentBuilder builder = factory.newDocumentBuilder();
  27. // 3. 调用parse方法获取Document对象
  28. Document document = builder.parse(uri);
  29. NodeList bookNodes = document.getElementsByTagName("书");
  30. Book book = null;
  31. for (int i = 0; i < bookNodes.getLength(); i++) {
  32. Element bookEle = (Element) bookNodes.item(i);
  33. book = new Book();
  34. String id = bookEle.getAttribute("id");
  35. book.setId(id);
  36. String publisher = bookEle.getAttribute("出版社");
  37. book.setPublisher(publisher);
  38. String bookName = bookEle.getElementsByTagName("书名").item(0)
  39. .getTextContent();
  40. book.setBookName(bookName);
  41. String author = bookEle.getElementsByTagName("作者").item(0)
  42. .getTextContent();
  43. book.setAuthor(author);
  44. String price = bookEle.getElementsByTagName("售价").item(0)
  45. .getTextContent();
  46. book.setPrice(price);
  47. books.add(book);
  48. book = null;
  49. }
  50.  
  51. return books;
  52. }
  53.  
  54. public static void addBook(Book book,String uri) throws Exception {
  55.  
  56. Document document = DocumentBuilderFactory.newInstance()
  57. .newDocumentBuilder().parse(uri);
  58. Node bookshelfNode = document.getElementsByTagName("书架").item(0);
  59. Element bookEle = document.createElement("书");
  60. bookEle.setAttribute("id",book.getId());
  61. bookEle.setAttribute("出版社",book.getPublisher());
  62. bookshelfNode.appendChild(bookEle);
  63. Node bookNameNode = bookEle.appendChild(document.createElement("书名"));
  64. bookNameNode.setTextContent(book.getBookName());
  65. Node authorNode = bookEle.appendChild(document.createElement("作者"));
  66. authorNode.setTextContent(book.getAuthor());
  67. Node priceNode = bookEle.appendChild(document.createElement("售价"));
  68. priceNode.setTextContent(book.getPrice());
  69.  
  70. TransformerFactory factory = TransformerFactory.newInstance();
  71. Transformer transformer = factory.newTransformer();
  72. transformer.transform(new DOMSource(document),new StreamResult(uri));
  73.  
  74. }
  75.  
  76. public static void updateBook(Book book,String uri) throws Exception {
  77.  
  78. Document document = DocumentBuilderFactory.newInstance()
  79. .newDocumentBuilder().parse(uri);
  80.  
  81. NodeList bookNodes = document.getElementsByTagName("书");
  82.  
  83. for (int i = 0; i < bookNodes.getLength(); i++) {
  84. Element bookEle = (Element) bookNodes.item(i);
  85. if (bookEle.getAttribute("id").equals(book.getId())) {
  86. bookEle.setAttribute("出版社",book.getPublisher());
  87. bookEle.getElementsByTagName("书名").item(0)
  88. .setTextContent(book.getBookName());
  89. bookEle.getElementsByTagName("作者").item(0)
  90. .setTextContent(book.getAuthor());
  91. bookEle.getElementsByTagName("售价").item(0)
  92. .setTextContent(book.getPrice());
  93. }
  94. }
  95.  
  96. TransformerFactory.newInstance().newTransformer()
  97. .transform(new DOMSource(document),new StreamResult(uri));
  98.  
  99. }
  100.  
  101. public static void deleteBook(String id,String uri) throws Exception {
  102. Document document = DocumentBuilderFactory.newInstance()
  103. .newDocumentBuilder().parse(uri);
  104. NodeList bookNodes = document.getElementsByTagName("书");
  105. for (int i = 0; i < bookNodes.getLength(); i++) {
  106. Element bookEle = (Element) bookNodes.item(i);
  107. if (bookEle.getAttribute("id").equals(id)) {
  108. bookEle.getParentNode().removeChild(bookEle);
  109. }
  110.  
  111. }
  112.  
  113. TransformerFactory.newInstance().newTransformer()
  114. .transform(new DOMSource(document),new StreamResult(uri));
  115.  
  116. }
  117. }
@H_301_0@SAX解析

@H_301_0@在使用 DOM 解析 XML 文档时,需要读取整个 XML 文档,在内存中构架代表整个 DOM 树的Doucment对象,从而再对XML文档进行操作。此种情况下,如果 XML 文档特别大,就会消耗计算机的大量内存,并且容易导致内存溢出。

@H_301_0@SAX解析允许在读取文档的时候,即对文档进行处理,而不必等到整个文档装载完才对文档进行操作。

@H_301_0@SAX采用事件处理的方式解析XML文件,利用 SAX 解析 XML 文档,涉及两个部分:解析器和事件处理器:

@H_301_0@解析器可以使用JAXP的API创建,创建出SAX解析器后,就可以指定解析器去解析某个XML文档。

@H_301_0@解析器采用SAX方式在解析某个XML文档时,它只要解析到XML文档的一个组成部分,都会去调用事件处理器的一个方法,解析器在调用事件处理器的方法时,会把当前解析到的xml文件内容作为方法的参数传递给事件处理器。

@H_301_0@事件处理器由程序员编写,程序员通过事件处理器中方法的参数,就可以很轻松地得到sax解析器解析到的数据,从而可以决定如何对数据进行处理。

@H_301_0@SAX方式解析XML文档

@H_301_0@1) 使用SAXParserFactory创建SAX解析工厂

@H_301_0@SAXParserFactory spf = SAXParserFactory.newInstance();

@H_301_0@2) 通过SAX解析工厂得到解析器对象

@H_301_0@SAXParser sp = spf.newSAXParser();

@H_301_0@3) 通过解析器对象得到一个XML的读取器

@H_301_0@XMLReader xmlReader = sp.getXMLReader();

@H_301_0@4) 设置读取器的事件处理器

@H_301_0@xmlReader.setContentHandler(new BookParserHandler());

@H_301_0@5) 解析xml文件

@H_301_0@xmlReader.parse("book.xml");

@H_301_0@DOM4J解析XML文档

@H_301_0@Dom4j是一个简单、灵活的开放源代码的库。Dom4j是由早期开发JDOM的人分离出来而后独立开发的。与JDOM不同的是,dom4j使用接口和抽象基类,虽然Dom4j的API相对要复杂一些,但它提供了比JDOM更好的灵活性。

@H_301_0@Dom4j是一个非常优秀的Java XML API,具有性能优异、功能强大和极易使用的特点。现在很多软件采用的Dom4j,例如Hibernate,包括sun公司自己的JAXM也用了Dom4j。

@H_301_0@使用Dom4j开发,需下载dom4j相应的jar文件

@H_301_0@DOM4j中,获得Document对象的方式有三种:

@H_301_0@1.读取XML文件,获得document对象

@H_301_0@SAXReader reader = new SAXReader();
Documentdocument = reader.read(new File("input.xml"));

@H_301_0@2.解析XML形式的文本,得到document对象.

@H_301_0@ String text = "<members></members>";
Document document = DocumentHelper.parseText(text);

@H_301_0@3.主动创建document对象.

@H_301_0@ Document document = DocumentHelper.createDocument();
//创建根节点

@H_301_0@ Element root = document.addElement("members");

@H_301_0@SAX解析代码实例

  1. import java.util.ArrayList;
  2. import java.util.List;
  3.  
  4. import javax.xml.parsers.SAXParser;
  5. import javax.xml.parsers.SAXParserFactory;
  6.  
  7. import org.xml.sax.Attributes;
  8. import org.xml.sax.SAXException;
  9. import org.xml.sax.XMLReader;
  10. import org.xml.sax.helpers.DefaultHandler;
  11.  
  12. import com.itheima.domain.Book;
  13.  
  14. public class SAXUtil {
  15. private static Book book = null;
  16. private static List<Book> books = new ArrayList<Book>();
  17.  
  18. public static List<Book> getBooks(String uri) throws Exception {
  19.  
  20. // 首先 获得 一个 工厂 对象
  21. SAXParserFactory factory = SAXParserFactory.newInstance();
  22.  
  23. // 通过工厂对象 整出 一个 解析器对象
  24. SAXParser parser = factory.newSAXParser();
  25.  
  26. // 拿到 一个 xml reader 对象.
  27. XMLReader xmlReader = parser.getXMLReader();
  28.  
  29. // 提前设置 好 事件 处理器
  30.  
  31. xmlReader.setContentHandler(new DefaultHandler() {
  32. String temp = null;
  33.  
  34. @Override
  35. public void startElement(String uri,String localName,String qName,Attributes attributes) throws SAXException {
  36. super.startElement(uri,localName,qName,attributes);
  37.  
  38. if ("书".equals(qName)) {
  39. book = new Book();
  40. book.setId(attributes.getValue("id"));
  41. book.setPublisher(attributes.getValue("出版社"));
  42. }
  43.  
  44. else if ("书名".equals(qName))
  45. temp = "书名";
  46. else if ("作者".equals(qName))
  47. temp = "作者";
  48. else if ("售价".equals(qName))
  49. temp = "售价";
  50.  
  51. }
  52.  
  53. @Override
  54. public void characters(char[] ch,int start,int length)
  55. throws SAXException {
  56. super.characters(ch,start,length);
  57.  
  58. if ("书名".equals(temp))
  59. book.setBookName(new String(ch,length));
  60. else if ("作者".equals(temp))
  61. book.setAuthor(new String(ch,length));
  62. else if ("售价".equals(temp))
  63. book.setPrice(new String(ch,length));
  64.  
  65. }
  66.  
  67. @Override
  68. public void endElement(String uri,String qName)
  69. throws SAXException {
  70. super.endElement(uri,qName);
  71. if ("书".equals(qName)) {
  72. books.add(book);
  73. book = null;
  74. }
  75. temp = null;
  76.  
  77. }
  78.  
  79. });
  80.  
  81. // 解析xml文件.
  82.  
  83. xmlReader.parse(uri);
  84.  
  85. return books;
  86. }
  87.  
  88. }
@H_301_0@pull 解析器

@H_301_0@pull 解析器是一个第三方的开源api,其解析原理与sax 解析原理很相像,都是采用事件驱动的方式.

@H_301_0@不同点: pull 解析器在每次读取到一段数据之后,需要程序员手动的调用其next() 方法,将当前解析到的这一行的"指针"移到下一行.

@H_301_0@http://www.xmlpull.org

@H_301_0@http://kxml.sourceforge.net/kxml2/

@H_301_0@在目前的android 平台中解析xml 文件都是采用pull解析器,是谷歌力推的xml解析器

@H_301_0@pull 解析器是一个开源的java项目,既可以用于android,也可以用于JavaEE。

@H_301_0@在android源码根目录的libcore目录下存放的是pull 解析器相关的所有类库.

@H_301_0@pull 解析代码实例

  1. import java.io.FileInputStream;
  2. import java.io.FileOutputStream;
  3. import java.util.ArrayList;
  4. import java.util.List;
  5.  
  6. import org.xmlpull.v1.XmlPullParser;
  7. import org.xmlpull.v1.XmlPullParserFactory;
  8. import org.xmlpull.v1.XmlSerializer;
  9.  
  10. import com.itheima.domain.Book;
  11.  
  12. public class PullUtil {
  13.  
  14. public static List<Book> getBooks(String uri) throws Exception {
  15.  
  16. // 通过 xmlpull parser 工厂整出 一个 工厂 对象.
  17. XmlPullParserFactory factory = XmlPullParserFactory.newInstance();
  18. // 拿到 一个解析器 对象 .
  19. XmlPullParser parser = factory.newPullParser();
  20. // 设置要解析的 xml文件 .
  21. parser.setInput(new FileInputStream(uri),"UTF-8");
  22. // 获得 eventtype (事件 类型 )
  23. int eventType = parser.getEventType();
  24. // 启动 一个 循环 去 一行行 读取 xml文件.
  25. Book book = null;
  26. List<Book> books = new ArrayList<Book>();
  27. while (eventType != XmlPullParser.END_DOCUMENT) {
  28. switch (eventType) {
  29. case XmlPullParser.START_TAG:
  30. if ("书".equals(parser.getName())) {
  31. book = new Book();
  32. for (int i = 0; i < parser.getAttributeCount(); i++) {
  33. if ("id".equals(parser.getAttributeName(i)))
  34. book.setId(parser.getAttributeValue(i));
  35. if ("出版社".equals(parser.getAttributeName(i)))
  36. book.setPublisher(parser.getAttributeValue(i));
  37. }
  38. }
  39. if ("书名".equals(parser.getName()))
  40. book.setBookName(parser.nextText());
  41. if ("作者".equals(parser.getName()))
  42. book.setAuthor(parser.nextText());
  43. if ("售价".equals(parser.getName()))
  44. book.setPrice(parser.nextText());
  45. break;
  46. case XmlPullParser.END_TAG:
  47.  
  48. if ("书".equals(parser.getName())) {
  49. books.add(book);
  50. }
  51. break;
  52. default:
  53. break;
  54. }
  55.  
  56. eventType = parser.next();
  57. }
  58. return books;
  59. }
  60.  
  61. public static void addBooks(List<Book> books,String uri) throws Exception {
  62. XmlSerializer serializer = XmlPullParserFactory.newInstance()
  63. .newSerializer();
  64. FileOutputStream fileOutputStream = new FileOutputStream(uri);
  65. serializer.setOutput(fileOutputStream,"UTF-8");
  66.  
  67. serializer.startDocument("UTF-8",true);
  68.  
  69. serializer.startTag(null,"书架");
  70. for (Book book : books) {
  71. serializer.startTag(null,"书");
  72. serializer.attribute(null,"id",book.getId());
  73. serializer.attribute(null,"出版社",book.getPublisher());
  74.  
  75. serializer.startTag(null,"书名");
  76. serializer.text(book.getBookName());
  77. serializer.endTag(null,"书名");
  78.  
  79. serializer.startTag(null,"作者");
  80. serializer.text(book.getAuthor());
  81. serializer.endTag(null,"作者");
  82.  
  83. serializer.startTag(null,"售价");
  84. serializer.text(book.getPrice());
  85. serializer.endTag(null,"售价");
  86.  
  87. serializer.endTag(null,"书");
  88. }
  89.  
  90. serializer.endTag(null,"书架");
  91. serializer.endDocument();
  92.  
  93. fileOutputStream.flush();
  94. fileOutputStream.close();
  95.  
  96. }
  97. }
@H_301_0@
DOM4Jdom4j.org出品的一个开源XML解析包。Dom4j是一个易用的、开源的库,用于XMLXPathXSLT。它应用于Java平台,采用了Java集合框架并完全支持DOMSAXJAXP

@H_301_0@dom4j 代码实例

  1. package com.itheima.util;
  2.  
  3. import java.io.FileInputStream;
  4. import java.io.FileOutputStream;
  5. import java.util.ArrayList;
  6. import java.util.Iterator;
  7. import java.util.List;
  8.  
  9. import org.dom4j.Document;
  10. import org.dom4j.Element;
  11. import org.dom4j.io.OutputFormat;
  12. import org.dom4j.io.SAXReader;
  13. import org.dom4j.io.XMLWriter;
  14.  
  15. import com.itheima.domain.Book;
  16.  
  17. public class Dom4jUtil {
  18. public static List<Book> getBooks(String uri) throws Exception {
  19. List<Book> books = new ArrayList<Book>();
  20. Book book = null;
  21. SAXReader reader = new SAXReader();
  22. Document document = reader.read(new FileInputStream(uri));
  23. Element rootEle = document.getRootElement();
  24. for (Iterator<Element> i = rootEle.elementIterator("书"); i.hasNext();) {
  25. Element bookEle = i.next();
  26. book = new Book();
  27. book.setId(bookEle.attributeValue("id"));
  28. book.setPublisher(bookEle.attributeValue("出版社"));
  29. book.setBookName(bookEle.elementText("书名"));
  30. book.setAuthor(bookEle.elementText("作者"));
  31. book.setPrice(bookEle.elementText("售价"));
  32. books.add(book);
  33. book = null;
  34. }
  35.  
  36. return books;
  37. }
  38.  
  39. public static void addBook(Book book,String uri) throws Exception {
  40. SAXReader reader = new SAXReader();
  41. Document document = reader.read(new FileInputStream(uri));
  42.  
  43. Element rootEle = document.getRootElement();
  44.  
  45. Element bookEle = rootEle.addElement("书")
  46. .addAttribute("id",book.getId())
  47. .addAttribute("出版社",book.getPublisher());
  48. bookEle.addElement("书名").addText(book.getBookName());
  49. bookEle.addElement("作者").addText(book.getAuthor());
  50. bookEle.addElement("售价").addText(book.getPrice());
  51.  
  52. OutputFormat format = OutputFormat.createPrettyPrint();
  53. format.setEncoding("UTF-8");
  54.  
  55. XMLWriter writer = new XMLWriter(new FileOutputStream(uri),format);
  56. writer.write(document);
  57. writer.close();
  58.  
  59. }
  60.  
  61. public static void deleteBook(String id,String uri) throws Exception {
  62. SAXReader reader = new SAXReader();
  63. Document document = reader.read(new FileInputStream(uri));
  64. Element rootEle = document.getRootElement();
  65. for (Iterator<Element> i = rootEle.elementIterator("书"); i.hasNext();) {
  66. Element bookEle = i.next();
  67. if (bookEle.attributeValue("id").equals(id))
  68. rootEle.remove(bookEle);
  69. }
  70.  
  71. OutputFormat format = OutputFormat.createPrettyPrint();
  72. format.setEncoding("UTF-8");
  73.  
  74. XMLWriter writer = new XMLWriter(new FileOutputStream(uri),format);
  75. writer.write(document);
  76. writer.close();
  77. }
  78.  
  79. public static void updateBook(Book book,String uri) throws Exception {
  80. SAXReader reader = new SAXReader();
  81. Document document = reader.read(new FileInputStream(uri));
  82. Element rootEle = document.getRootElement();
  83. for (Iterator<Element> i = rootEle.elementIterator("书"); i.hasNext();) {
  84. Element bookEle = i.next();
  85. if (bookEle.attributeValue("id").equals(book.getId())) {
  86. bookEle.attribute("出版社").setValue(book.getPublisher());
  87. bookEle.element("书名").setText(book.getBookName());
  88. bookEle.element("作者").setText(book.getAuthor());
  89. bookEle.element("售价").setText(book.getPrice());
  90. }
  91.  
  92. OutputFormat format = OutputFormat.createPrettyPrint();
  93. format.setEncoding("UTF-8");
  94.  
  95. XMLWriter writer = new XMLWriter(new FileOutputStream(uri),format);
  96. writer.write(document);
  97. writer.close();
  98.  
  99. }
  100.  
  101. }
  102. }

猜你在找的XML相关文章