写了这么多的配置文件（XML），你真的了解它吗？

什么是XML

XML（eXtendsible Markup Language）即可标记行扩展语言

XML 可以干啥

保存数据
用作配置文件
数据传输载体

XML 文件构成

后缀名

XML 文件都是以 .xml 为后缀

文档声明

最基本的声明
```
<?xml version="1.0" ?>
```
带编码（默认为 GBK，一般我们选用 UTF-8），想让 XML 正常显示中文，必须保证 encoding 编码格式与我们文件的编码保存格式一致
```
<?xml version="1.0" encoding="UTF-8" ?>
```
关联文件（standalone ： no - 该文档依赖关联其他文档 yes - 该文档是一个独立的文档）
```
<?xml version="1.0" encoding="gbk" standalone="no" ?>
```

元素定义

格式：与 HTML 类似，使用 <> 包裹的成为标签，一般对出现（除了空标签），例如：

<!-- 成堆出现 -->
<student></student>
<!-- 空标签，标签中间并没有内容，一般配合属性使用 -->
<age/>

XML 的标签是可以自定义的，但是必须遵从命名规则

名称可以含字母、数字以及其他的字符 
名称不能以数字或者标点符号开始 
名称不能以字符 “xml”（或者 XML、Xml）开始 
名称不能包含空格

注：命名尽量简单，做到见名知义

元素类型

简单元素

<!-- 简单元素中间仅包含了普通的文字 -->
<student></student>

复杂元素

<!-- 复杂元素嵌套其他元素 student就是一个复杂元素 -->
<student>
    <name>张三</name>
    <age>12</age>
</student>

属性定义

前面说空标签一般配合属性使用，当然普通的标签属性同样可以使用

格式：<元素名称属性名称="属性的值"></元素名称>

<stus>
    <!-- id 是stu的属性 -->
    <stu id="1001">
        <name>张三</name>
        <age>18</age>
    </stu>
    <stu id="1002">
        <name>李四</name>
        <age>28</age>
    </stu>
</stus>

注释

与 HTML 注释一样

<?xml version="1.0" encoding="UTF-8"?>
<!-- 这是一行注释 -->

注： xml的注释，不允许放置在文档的第一行。必须在文档声明的下面。

CDATA

XML 文档中的文本都会被解析器解析，有时候我们希望某些元素内部的文本不要去解析，比方说下面的student 元素，我们希望他内部的 name ，age 都不要解析为元素，显然单纯下面这种是无法完成这种效果的

<student><name>张三</name><age>12</age></student>

这是为什么呢，这就涉及到 XML的非法字符

<name>张三</name><age>12</age>如果不想被解析的话，其所有的字符都要被识别为普通文本，但是 < 字符会被识别为一个元素的开始，我们同样不能在元素内部使用 > <

<!-- 这种方式是错误的 -->
<age> age > 20 </age>

想要解决这个问题，我们必须将非法的字符转换为实体引用

<!-- 小于号的实体引用为 &gt; -->
<age> age &gt; 20 </age>

XML 预定义实体引用

符号	实体引用
<	<
>	>
&	&
'	'
"	"

注：严格地讲，在 XML 中仅有字符 "<"和"&" 是非法的。省略号、引号和大于号是合法的，但是把它们替换为实体引用是个好的习惯。

如果我们内部需要使用大量的包含类似标签和关键字（“<” 和 “&”）的这种文字，同时我们又不想要 XML 解析器去解析，此时，我们就需要使用 CDATA 了。

CDATA ：是指不应该由 XML 解析器进行解析的文本数据。CDATA 部分的所有内容都会被解析器忽略。

使用格式 ：

<![CDATA[  这里面是文本区域  ]]>

<des><![CDATA[<a href="http://www.baidu.com">百度 && 网址</a>]]></des>

在 CDATA 内部就可以使用 < & 符号而不会报错了

注： CDATA 部分不能包含字符串 “]]>”,不允许嵌套 CDATA 部分。标记 CDATA 结尾部分“]]>”不能包含空格或拆行。

XML 解析 (Java)

解析XML实际上就是获取元素的字符数据和属性数据

常用解析方式

DOM（可以对文档进行增删操作）
SAX（只能查询）

DOM（document object model）： 把整个xml全部读取到内存，形成树状的结构，整个文档称之为document 对象，属性对应为 attribute 对象，元素节点对应为 element 对象，文本称之为 text 对象，他们统称为 node 对象，因为是全部读入，当xml文件特别大的时候，可能会造成内存溢出。

SAX（simple API for xml）： 基于事件驱动，读取一行解析一行，不会出现内存溢出

解决方案

jaxp：sun公司
jdom
dom4j：使用比较广泛

dom4j 的基本使用

Maven依赖

<dependency>
    <groupId>dom4j</groupId>
    <artifactId>dom4j</artifactId>
    <version>1.6.1</version>
</dependency>

最基本用法

element.element("stu"); //返回该元素下的第一个stu元素
element.elements(); //返回该元素下的所有子元素。

一般步骤：

创建 SaxReader 对象
指定解析的 XML
获取根元素
根据根元素获取子元素以及子孙元素

try {
    //1. 创建sax读取对象
    SAXReader reader = new SAXReader(); //jdbc -- classloader
    //2. 指定解析的xml源
    Document  document  = reader.read(new File("src/xml/stus.xml"));
    //3. 得到根元素
    Element rootElement= document.getRootElement();

    //获取根元素下面的子元素 age
    //rootElement.element("age") 
    //System.out.println(rootElement.element("stu").element("age").getText());
    //获取根元素下面的所有子元素 。 stu元素
    List<Element> elements = rootElement.elements();
    //遍历所有的stu元素
    for (Element element : elements) {
        //获取stu元素下面的name元素
        String name = element.element("name").getText();
        String age = element.element("age").getText();
        String address = element.element("address").getText();
        System.out.println("name="+name+"==age+"+age+"==address="+address);
    }
        
} catch (Exception e) {
    e.printStackTrace();
}

Xpath 使用

使用上面方式获取子孙节点时会特别的繁琐，dom4j 支持 Xpath的写法（ xpath其实是xml的路径语言，支持我们在解析xml的时候，能够快速的定位到具体的某一个元素）

添加依赖

<dependency>
    <groupId>jaxen</groupId>
    <artifactId>jaxen</artifactId>
    <version>1.1</version>
</dependency>

简单使用

// 获取第一个 name 元素
Element nameElement = (Element) rootElement.selectSingleNode("//name");
// 获取文档里面的所有name元素 
List<Element> list = rootElement.selectNodes("//name");

约束

上面的XML文件中，我们所有的元素都可以随便写，像学生的id属性可以一样，学生姓名可以有多个...这显然是不符合现实的。因此我们需要对XML文件作出一定的约束，来控制XML文件满足我们的要求

约束方式

DTD
Schema

DTD

语法自成一派，早期就出现的，可读性比较差

使用方式

引用网上的DTD

<!-- 引入dtd 来约束这个xml -->
<!--  文档类型  根标签名字 网络上的dtd   dtd的名称   dtd的路径 -->
<!DOCTYPE stus PUBLIC "//UNKNOWN/" "unknown.dtd">

使用本地DTD

<!-- 引入本地的DTD  ： 根标签名字 引入本地的DTD  dtd的位置 -->
<!DOCTYPE stus SYSTEM "stus.dtd">

内嵌使用

<!DOCTYPE stus [
          <!ELEMENT stus (stu)>
          <!ELEMENT stu (name,age)>
          <!ELEMENT name (#PCDATA)>
          <!ELEMENT age (#PCDATA)>
      ]>

DTD 编写格式

<!ELEMENT stus (stu)>   stus 下面有一个元素 stu  ， 但是只有一个
<!ELEMENT stu (name , age)>  stu下面有两个元素 name  ,age  顺序必须name-age
<!ELEMENT name (#PCDATA)> 
<!ELEMENT age (#PCDATA)>
<!ATTLIST stu id CDATA #IMPLIED> stu有一个属性 文本类型， 该属性可有可无
<!ELEMENT stu (name , age)>     按照顺序来 
<!ELEMENT stu (name | age)>   两个中只能包含一个子元素

元素的个数：
        ＋　一个或多个
        *  零个或多个
        ? 零个或一个
属性的类型定义 
        CDATA : 属性是普通文字
        ID : 属性的值必须唯一

Schema

其实就是一个xml ，使用xml的语法规则， xml解析器解析起来比较方便，是为了替代DTD 。
但是Schema 约束文本内容比DTD的内容还要多。所以目前也没有真正意义上的替代DTD

使用scheme约束例子：

约束文件

<!-- xmlns  :  xml namespace : 名称空间 /  命名空间
    targetNamespace :  目标名称空间 。 下面定义的那些元素都与这个名称空间绑定上。 
    elementFormDefault ： 元素的格式化情况。  -->
<schema xmlns="http://www.w3.org/2001/XMLSchema" 
        targetNamespace="http://www.itheima.com/teacher" 
        elementFormDefault="qualified">

    <element name="teachers">
        <complexType>
            <sequence maxOccurs="unbounded">
                <!-- 这是一个复杂元素 -->
                <element name="teacher">
                    <complexType>
                        <sequence>
                            <!-- 以下两个是简单元素 -->
                            <element name="name" type="string"></element>
                            <element name="age" type="int"></element>
                        </sequence>
                    </complexType>
                </element>
            </sequence>
        </complexType>
    </element>
</schema>

被约束文件

<?xml version="1.0" encoding="UTF-8"?>
    <!-- xmlns:xsi : 这里必须是这样的写法，也就是这个值已经固定了。
    xmlns : 这里是名称空间，也固定了，写的是schema里面的顶部目标名称空间
    xsi:schemaLocation : 有两段： 前半段是名称空间，也是目标空间的值 ， 后面是约束文档的路径。-->
    <teachers xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
              xmlns="http://www.itheima.com/teacher"
              xsi:schemaLocation="http://www.itheima.com/teacher teacher.xsd">
        <teacher>
            <name>zhangsan</name>
            <age>19</age>
        </teacher>
        <teacher>
            <name>lisi</name>
            <age>29</age>
        </teacher>
        <teacher>
            <name>lisi</name>
            <age>29</age>
        </teacher>
    </teachers>

命名空间

一个xml如果想指定它的约束规则，假设使用的是DTD ，那么这个xml只能指定一个DTD ，不能指定多个DTD 。但是如果一个xml的约束是定义在schema里面，并且是多个schema，那么是可以的。简单的说：一个xml 可以引用多个schema约束。但是只能引用一个DTD约束。

名称空间的作用就是在写元素的时候，可以指定该元素使用的是哪一套约束规则。默认情况下，如果只有一套规则，那么都可以这么写

<name>张三</name>
<!-- 添加前缀来避免命名冲突 -->
<aa:name></aa:name>
<bb:name></bb:name>

<!-- 使用命名空间 默认命名空间不需要加命名空间前缀-->
<!-- xmlns:命名空间前缀="命名空间的URL" -->
<h:table xmlns:h="http://www.w3.org/TR/html4/">
   <h:tr>
   <h:td>Apples</h:td>
   <h:td>Bananas</h:td>
   </h:tr>
</h:table>
<f:table xmlns:f="http://www.w3school.com.cn/furniture">
   <f:name>African Coffee Table</f:name>
   <f:width>80</f:width>
   <f:length>120</f:length>
</f:table>

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 218,122评论 6赞 505
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,070评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,491评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,636评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,676评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,541评论 1赞 305
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,292评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,211评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,655评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,846评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,965评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,684评论 5赞 347
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,295评论 3赞 329
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,894评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,012评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,126评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,914评论 2赞 355