xml, Extensible Markup Language,可扩展的标记语言。
xml文档的规则
1.0 xml文档必须以一个xml声明开始
2.0 xml文档有且只有一个根元素。
3.0 开始标记和结束标记必须成对出现。
4.0 各元素之间正确嵌套。
5.0 xml标记都是大小写敏感的。
6.0 属性必须用引号" ";
列子
<?xml version="1.0" encoding="utf-8"?>
<!-- 我是注释 -->
<魔鬼名单>
<魔鬼 职务="天使长">
<name>路西法</name>
<age>9999</age>
<sex>man</sex>
</魔鬼>
<魔鬼>
<name>洛基</name>
<age>6666</age>
<sex>man</sex>
</魔鬼>
</魔鬼名单>
<?xml version="1.0" encoding="utf-8"?> 是xml的声明,以<?xml 开始,以?>结束,version是版本(好像只能取1.0),encoding是字符编码。
xml元素命名规范
与html不同,xml没有预置任何元素,允许开发者自定义,但是有规范。
1.0 名字必须以 _(下划线)或者字母开头。
2.0 名字不能出现xml,Xml等任意大小写组合开始。
。。。。。。
xml的属性
形式 <开始标记 属性1=" 属性值1 ",属性2=" 属性值2 "........> 数据内容 </结束标记>
规则:
1.0 属性命名规则同元素命名。
2.0 属性值必须用引号值括起来。
3.0 属性值只能包含在开始标记。
4.0 特定的属性名称在同一元素只能出现一次。
一个元素特征可以用其子元素来表示,属性可以描述元素特征,但是定义过多属性会降低程序可读性。
<date year="2018" month="3" day="19"></date>
<date>
<year>2018</year>
<month>3</month>
<day>19</day>
</date>
上面2个是等价的。
空元素
如果元素不包含任何文本,那么它就是空元素,空元素不可接受字元素。
形式: <标记名称 属性列表/> 或者 <标记名称/> 或者 <标记名称></标记名称>
<dflx/>
<dflx></dflx>
<dflx lover="雨"/>
由于空元素不包含任何内容,因此在编写xml的时候,空元素主要用于抽象带有属性的数据,该数据本身并不需要用具体的文本来进行描述。
元素嵌套
1.0 父元素的起始标记必须在子元素的起始标记前,父元素的结束标记必须在子元素的结束标记后,元素之间不可交叉嵌套。
2.0 子元素和子元素间是兄弟关系。
3.0 二个元素之间不能即是父子关系又是兄弟关系。
实体引用和CDATA段
开始标记和结束标记之间的文本可以是任何Unicode字符,但是如果文本包含一些特殊的字符,可以采用实体引用或者CDATA段。
比如:
<exprect>1+1<
6</exprect>
结果是:
<exprect>1+1<6</exprect>
xml预置的5个实体引用。
'<' 所代表的符号<, >
所代表的符号为>
'&' 所代表的符号为&,
' 所代表的符号为'; "所代表的符号为".
如果文本包含大量的>,<,&等特殊符号,需要发大量时间转换,这时用CDATA段解决。
格式: <![CDATA[文本内容]]>
<python>
<![CDATA[
if(you love my article)
plase mark me;
]]>
</python>
命名空间
xml最大特点就是易扩展性,它允许用户自定义标记,这个给用户非常大的自由空间,但是同时也出现了标记名称重复性的问题。为解决标记名称相同的情况,采用命名空间解决。
有前缀的命名空间: xmlns:前缀="命名空间的名字";
无前缀的命名空间: xmlns=命名空间的名字;
命名空间前缀不能用 xml, xmlns,并且前缀之间不能有空格。如果命名空间名字相同则称命名空间相同。
xmlns:north="lz"
xmlns:north="liao"
这个只是前缀相同,名称空间不同。
xmlns:hello="microsoft"
xmlns:ok="microsoft"
这2个命名空间相同,都是apple.
在标记中声明命名空间必须放在开始标记,放在开始标记的标记名称空间后面。
如果一个标记有声明前缀的命名空间,必须通过放在标记名称前面添加的空间前缀和冒号来引用命名空间。一个标记可以声明多个命名空间
<student xmlns:class1="software" xmlns:class2="cs">
<class1:张三>sex:man</class1:张三>
<class2:李四>sex:man</class2:李四>
</student>
命名空间的作用域:命名空间的作用域就是该命名空间的作用范围。
1.0 一个无前缀的标记的命名空间作用域,是该标记及其子标记。
2.0 如果是有前缀名称的标记命名空间,其子元素如果想属于该空间,需要通过引用名称空间的前缀来继承命名空间。
<student xmlns:class1="software">
<class1:张三>sex:man</class1:张三>
<李四>sex:man</李四>
</student>
比如这个,张三属于software命名空间,李四就不输入。