XML优点:平台无关性,语言无关性,系统无关性
XML在不同的语言里解析方式都是一样的,只不过实现的语法不同而已。基本的解析方式有两种,一种叫SAX,另一种叫DOM。SAX是基于事件流的解析,DOM是基于XML文档树结构的解析.假设我们XML的内容和结构如下:
<?@H_301_15@xml@H_301_15@version@H_301_15@="1.0"@H_301_15@encoding@H_301_15@="UTF-8"@H_301_15@?>@H_301_15@
<@H_301_15@name@H_301_15@>@H_301_15@ddviplinux</@H_301_15@name@H_301_15@>@H_301_15@
<@H_301_15@sex@H_301_15@>@H_301_15@m</@H_301_15@sex@H_301_15@>@H_301_15@
<@H_301_15@age@H_301_15@>@H_301_15@30</@H_301_15@age@H_301_15@>@H_301_15@
下面是解析XMl常用的Dom和Sex方法:
1.DOM生成和解析XML文档
为 XML 文档的已解析版本定义了一组接口。解析器读入整个文档,然后构建一个驻留内存的树结构,然后代码就可以使用 DOM 接口来操作这个树结构。优点:整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能;缺点:将整个文档调入内存(包括无用的节点),浪费时间和空间;使用场合:一旦解析了文档还需多次访问这些数据;硬件资源充足(内存、cpu)。
try@H_301_15@ {
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
DocumentBuilder db = dbf.newDocumentBuilder();
Document document = db.parse(fileName);
NodeList employees = document.getChildNodes();
for@H_301_15@ (int@H_301_15@ i = 0@H_301_15@; i < employees.getLength(); i++) {
Node employee = employees.item(i);
NodeList employeeInfo = employee.getChildNodes();
for@H_301_15@ (int@H_301_15@ j = 0@H_301_15@; j < employeeInfo.getLength(); j++) {
Node node = employeeInfo.item(j);
NodeList employeeMeta = node.getChildNodes();
for@H_301_15@ (int@H_301_15@ k = 0@H_301_15@; k < employeeMeta.getLength(); k++) {
System.out.println(employeeMeta.item(k).getNodeName() + ":"@H_301_15@ + employeeMeta.item(k).getTextContent());
}
}
}
System.out.println("解析完毕"@H_301_15@);
} catch@H_301_15@ (Exception e) {
System.out.println(e.getMessage());
}
}
2.SAX生成和解析XML文档
为解决DOM的问题,出现了SAX。SAX ,事件驱动。当解析器发现元素开始、元素结束、文本、文档的开始或结束等时,发送事件,程序员编写响应这些事件的代码,保存数据。优点:不用事先调入整个文档,占用资源少;SAX解析器代码比DOM解析器代码小,适于Applet,下载。缺点:不是持久的;事件过后,若没保存数据,那么数据就丢了;无状态性;从事件中只能得到文本,但不知该文本属于哪个元素;使用场合:Applet;只需XML文档的少量内容,很少回头访问;机器内存少;