前言
一直想系统性的学XML,就没时间学,今晚抽出几个小时时间学完了XML。过几天再过来看看,背一背应该就差不多,记得东西较多,没什么难理解的。
XML数据传输格式
第一章 XML概述
1.1 引入
当我们看到 XML 标准突飞猛进的开发进度,以及大批的软件开发商采用这个标准的日新月异的速度时,真的是不禁感叹这真是令人叹为观止。
目前,XML 在 Web 中起到的作用不会亚于一直作为 Web 基石的 HTML。
XML 无所不在。XML 是各种应用程序之间进行数据传输的最常用的工具,并且在信息存储和描述领域变得越来越流行。
XML的主要用途有哪些?
1.程序之间的数据传输通讯(可以是跨语言传输)2.配置文件config.xml
3.存储数据,充当小型数据库
优势:
规范数据格式,是数据具有结构性,易读易处理
1.2 什么是XML
XML 指可扩展标记语言(eXtensible Markup Language),被设计用来传输和存储数据;XML 需要自行定义标签,且标签名称具有自我描述性;XML 是 W3C 推荐的数据传输存放标准。
XML和HTML的区别?
1.html标签不能自定义,XML只能自定义标签。2.html语法要求不严格,xml对于语法的要求非常严格,标签必须是闭合的。
第二章 XML的基本语法
2.1 语法规则
1.XML 文档必须有根元素,根元素是所有其他元素的父元素。
2.XML声明语句是可选部分,如果存在需要放在文档的第一行
所谓的文档声明就是告诉解析器当前文档格式、版本号以及编码格式。
3.所有的 XML 元素都必须是成对闭合标签;非闭合标签是非法的,解析器将报错,不无正常解析.
5.XML标签不允许有交叉嵌套,也就是父子标签关系不能交叉嵌套。
6.XML标签名不要使用特殊字符,尽量只用数字字母下划线。
7.XML 中的注释与HTML中注释一个语法格式。
8.实体引用 & 特殊字符
在 XML 中,一些字符拥有特殊的意义,如果您把字符 "<" 放在 XML 元素中,会发生错误,这是因为解析器会把它当作新元素的开始
<age>46 < 100 </age>
这样会产生 XML 错误;
实体引用 | 实体字符 | 含义 |
---|---|---|
< | < | 小于-less than |
> | > | 大于-greater than |
& | & | 与--ampersand |
&apos | ' | 单引号-apostrophe |
" | " | 双引号-quotation mark |
2.2 元素属性
属性值一定要用引号(单引号或双引号)引起来元素中的属性是不允许重复的
属性也是用来存储数据信息的但实际开发经验是 在HTML中,属性用起来很便利,而在 XML 中,应该尽量避免使用属性,原因是
1.一个属性不能包含多个值(元素可以)2.属性值不能是结构化数据(元素可以)
3.属性不容易扩展(为未来的变化)
4.属性难以阅读和维护。
总结:将数据放在属性中和放在子元素中,目的都是为了传输数据,而子元素更加容易被解析,更好维护,更便于引用。
2.3 CDATA
要处理大量特殊字符时,不能再用实体引用来处理了(主要是太麻烦,工作量大)可以使用CDATA将数据包裹就可以按原格式输出。
格式:
<test><![CDATA[第一题题1:已知 c<4,d>5,问:c和d那个更好看? ]]> </test>
实体引用和CDATA的使用时机:
1.对于内容比较少的情况,可以使用实体引用对特殊字符进行直接替换操作。2.对于内容比较多的情况,建议采用CDATA区段。
第三章 使用PHP解析XML文档
在PHP5版本以后,其提供了一个非常非常强大的类库,SimpleXML类库,专门用于实现对XML文档的解析操作。PHP中使用这个类库来处理XML数据。
3.1 XML解析原理
XML在解析时一共要经历三个步骤:
- 读取XML文档到内存
2.形成DOM树结构(DOM树可以简单理解文档的父子结构)
3.生成SimpleXML对象
3.2 SimpleXML类库
语法:simplexml_load_file('test.xml');
- <?xml version="1.0" encoding="UTF-8"?>
- <user>
- <man>
- <name>aklman</name>
- <age>20</age>
- <sex>男</sex>
- </man>
- <man sex="男">
- <name>ak</name>
- <age>22</age>
- </man>
- </user>
1.如果当前读取的节点是对象就通过->来进行访问;2.如果当前读取的节点是数组就通过[]来进行访问;
3.3 遍历XML数据
1.foreach循环遍历
- $xml=simplexml_load_file('test.html);
- foreach($xml->man as $v){
- echo 'Name:'.$v->name.'Age:'.$v->age.'<br>';
- }
2.for循环遍历
- $xml=simplexml_load_file('test.html);
- $length=count($xml);
- for($i=0;$i<$length;$i++){
- echo $xml->man[$i]->name;
- }
读取节点的属性时XML属性要加到父节点,PHP才能解析
3.4 使用SImpleXML增加节点
3.5 案例
查询手机归属地案例,数据来源聚合网
- <form action="03.5.PHP" method="get">
- <input type="text" name="num"><br>
- <input type="submit" value="提交">
- </form>
- //接受前台提交的数据
- $tel = $_GET['num'];
- //组装请求地址
- $url = 'http://v.juhe.cn/telephone/index?telephoneNumber='.$tel.'&dtype=xml&format=&key=810c3b2c488bc37d5f521196d8799a7211';//地址已经打乱了,需要从聚合网购买
- //发送请求并接受返回的数据
- $s = file_get_contents($url);
- // echo $s; //打印返回的XML数据
- //使用 simplexml_load_string 函数读入并解析XML数据
- $xml = simplexml_load_string($s);
- //找到并打印我们想要的数据
- echo '归属省:'.$xml->result->place->city111.'<hr>';
- echo '归属城市:'.$xml->result->place->city.'<hr>';
第四章 Xpath语言
4.1 概述
XPath是一门在 XML 文档中查找信息的语言,XPath可用来在 XML 文档中对元素和属性进行遍历。
4.2 使用及语法
使用注意事项:
1.使用绝对路径实现数据查询
2.使用相对路径实现数据查询
- $xml = simplexml_load_file('user.xml');
- //按节点的相对路径查找
- $data = $xml->xpath('//name');//返回数组
- foreach($data as $v){
- echo $v.'<hr>';
- }
- /*
- *如果路径以双斜线 // 开头,则表示选择文档中所有满足双斜线//之后规则的元素(无论层级关系)
- */
3.使用*来匹配所有节点
- $xml = simplexml_load_file('user.xml');
- //匹配man节点下的所有元素节点。
- $data = $xml->xpath('//man/*');//返回数组
- foreach($data as $v){
- echo $v.'<hr>';
- }
4.使用[]方括号的形式来实现数据查询
5.使用属性来获取元素
- $xml = simplexml_load_file('user.xml');
- //匹配man节点下含有sex属性的节点。
- $data = $xml->xpath('//man[@sex]');//返回数组
- var_dump($data);
- echo $data[0]->name;