写了这么多的配置文件(XML),你真的了解它吗?

什么是XML

XML(eXtendsible Markup Language)即可标记行扩展语言

XML 可以干啥

  • 保存数据
  • 用作配置文件
  • 数据传输载体

XML 文件构成

后缀名

XML 文件都是以 .xml 为后缀

文档声明

  • 最基本的声明

    <?xml version="1.0" ?>
    
  • 带编码(默认为 GBK,一般我们选用 UTF-8),想让 XML 正常显示中文,必须保证 encoding 编码格式与我们文件的编码保存格式一致

    <?xml version="1.0" encoding="UTF-8" ?>
    
  • 关联文件 (standalone : no - 该文档依赖关联其他文档 yes - 该文档是一个独立的文档)

    <?xml version="1.0" encoding="gbk" standalone="no" ?>
    

元素定义

格式 : 与 HTML 类似,使用 <> 包裹的成为标签,一般对出现(除了空标签),例如:

<!-- 成堆出现 -->
<student></student>
<!-- 空标签,标签中间并没有内容,一般配合属性使用 -->
<age/>

XML 的标签是可以自定义的,但是必须遵从命名规则

名称可以含字母、数字以及其他的字符 
名称不能以数字或者标点符号开始 
名称不能以字符 “xml”(或者 XML、Xml)开始 
名称不能包含空格 

注: 命名尽量简单,做到见名知义

元素类型

  • 简单元素

    <!-- 简单元素中间仅包含了普通的文字 -->
    <student></student>
    
  • 复杂元素

    <!-- 复杂元素嵌套其他元素 student就是一个复杂元素 -->
    <student>
        <name>张三</name>
        <age>12</age>
    </student>
    

属性定义

前面说空标签一般配合属性使用,当然普通的标签属性同样可以使用

格式:<元素名称 属性名称="属性的值"></元素名称>

<stus>
    <!-- id 是stu的属性 -->
    <stu id="1001">
        <name>张三</name>
        <age>18</age>
    </stu>
    <stu id="1002">
        <name>李四</name>
        <age>28</age>
    </stu>
</stus>

注释

与 HTML 注释一样

<?xml version="1.0" encoding="UTF-8"?>
<!-- 这是一行注释 -->

注: xml的注释,不允许放置在文档的第一行。 必须在文档声明的下面。

CDATA

XML 文档中的文本都会被解析器解析,有时候我们希望某些元素内部的文本不要去解析,比方说下面的student 元素,我们希望他内部的 name ,age 都不要解析为元素,显然单纯下面这种是无法完成这种效果的

<student><name>张三</name><age>12</age></student>

这是为什么呢,这就涉及到 XML的非法字符

<name>张三</name><age>12</age>如果不想被解析的话,其所有的字符都要被识别为普通文本,但是 < 字符会被识别为一个元素的开始,我们同样不能在元素内部使用 > <

<!-- 这种方式是错误的 -->
<age> age > 20 </age>

想要解决这个问题,我们必须将非法的字符转换为实体引用

<!-- 小于号的实体引用为 &gt; -->
<age> age &gt; 20 </age>

XML 预定义实体引用

符号 实体引用
< &lt;
> &gt;
& &amp;
' &apos;
" &quot;

注:严格地讲,在 XML 中仅有字符 "<"和"&" 是非法的。省略号、引号和大于号是合法的,但是把它们替换为实体引用是个好的习惯。

如果我们内部需要使用大量的包含类似标签和关键字(“<” 和 “&”)的这种文字,同时我们又不想要 XML 解析器去解析,此时,我们就需要使用 CDATA 了。

CDATA :是指不应该由 XML 解析器进行解析的文本数据。CDATA 部分的所有内容都会被解析器忽略。

使用格式

<![CDATA[  这里面是文本区域  ]]>

<des><![CDATA[<a href="http://www.baidu.com">百度 && 网址</a>]]></des>

在 CDATA 内部就可以使用 < & 符号而不会报错了

注: CDATA 部分不能包含字符串 “]]>”,不允许嵌套 CDATA 部分。标记 CDATA 结尾部分“]]>”不能包含空格或拆行。

XML 解析 (Java)

解析XML实际上就是获取元素的字符数据属性数据

常用解析方式

  • DOM(可以对文档进行增删操作)
  • SAX(只能查询)

DOM(document object model): 把整个xml全部读取到内存,形成树状的结构,整个文档称之为document 对象,属性对应为 attribute 对象,元素节点对应为 element 对象,文本称之为 text 对象,他们统称为 node 对象,因为是全部读入,当xml文件特别大的时候,可能会造成内存溢出。

SAX(simple API for xml): 基于事件驱动,读取一行解析一行,不会出现内存溢出

解决方案

  • jaxp:sun公司
  • jdom
  • dom4j:使用比较广泛

dom4j 的基本使用

Maven依赖

<dependency>
    <groupId>dom4j</groupId>
    <artifactId>dom4j</artifactId>
    <version>1.6.1</version>
</dependency>

最基本用法

element.element("stu"); //返回该元素下的第一个stu元素
element.elements(); //返回该元素下的所有子元素。

一般步骤:

  • 创建 SaxReader 对象
  • 指定解析的 XML
  • 获取根元素
  • 根据根元素获取子元素以及子孙元素
try {
    //1. 创建sax读取对象
    SAXReader reader = new SAXReader(); //jdbc -- classloader
    //2. 指定解析的xml源
    Document  document  = reader.read(new File("src/xml/stus.xml"));
    //3. 得到根元素
    Element rootElement= document.getRootElement();

    //获取根元素下面的子元素 age
    //rootElement.element("age") 
    //System.out.println(rootElement.element("stu").element("age").getText());
    //获取根元素下面的所有子元素 。 stu元素
    List<Element> elements = rootElement.elements();
    //遍历所有的stu元素
    for (Element element : elements) {
        //获取stu元素下面的name元素
        String name = element.element("name").getText();
        String age = element.element("age").getText();
        String address = element.element("address").getText();
        System.out.println("name="+name+"==age+"+age+"==address="+address);
    }
        
} catch (Exception e) {
    e.printStackTrace();
}

Xpath 使用

使用上面方式获取子孙节点时会特别的繁琐,dom4j 支持 Xpath的写法( xpath其实是xml的路径语言,支持我们在解析xml的时候,能够快速的定位到具体的某一个元素)

添加依赖

<dependency>
    <groupId>jaxen</groupId>
    <artifactId>jaxen</artifactId>
    <version>1.1</version>
</dependency>

简单使用

// 获取第一个 name 元素
Element nameElement = (Element) rootElement.selectSingleNode("//name");
// 获取文档里面的所有name元素 
List<Element> list = rootElement.selectNodes("//name");

约束

上面的XML文件中,我们所有的元素都可以随便写,像学生的id属性可以一样,学生姓名可以有多个...这显然是不符合现实的。因此我们需要对XML文件作出一定的约束,来控制XML文件满足我们的要求

约束方式

  • DTD
  • Schema

DTD

语法自成一派, 早期就出现的, 可读性比较差

使用方式

  • 引用网上的DTD

    <!-- 引入dtd 来约束这个xml -->
    <!--  文档类型  根标签名字 网络上的dtd   dtd的名称   dtd的路径 -->
    <!DOCTYPE stus PUBLIC "//UNKNOWN/" "unknown.dtd">
    
  • 使用本地DTD

    <!-- 引入本地的DTD  : 根标签名字 引入本地的DTD  dtd的位置 -->
    <!DOCTYPE stus SYSTEM "stus.dtd">
    
  • 内嵌使用

    <!DOCTYPE stus [
              <!ELEMENT stus (stu)>
              <!ELEMENT stu (name,age)>
              <!ELEMENT name (#PCDATA)>
              <!ELEMENT age (#PCDATA)>
          ]>
    

DTD 编写格式

<!ELEMENT stus (stu)>   stus 下面有一个元素 stu  , 但是只有一个
<!ELEMENT stu (name , age)>  stu下面有两个元素 name  ,age  顺序必须name-age
<!ELEMENT name (#PCDATA)> 
<!ELEMENT age (#PCDATA)>
<!ATTLIST stu id CDATA #IMPLIED> stu有一个属性 文本类型, 该属性可有可无
<!ELEMENT stu (name , age)>     按照顺序来 
<!ELEMENT stu (name | age)>   两个中只能包含一个子元素
元素的个数:
        + 一个或多个
        *  零个或多个
        ? 零个或一个
属性的类型定义 
        CDATA : 属性是普通文字
        ID : 属性的值必须唯一

Schema

其实就是一个xml , 使用xml的语法规则, xml解析器解析起来比较方便 , 是为了替代DTD 。
但是Schema 约束文本内容比DTD的内容还要多。 所以目前也没有真正意义上的替代DTD

使用scheme约束例子:

约束文件

<!-- xmlns  :  xml namespace : 名称空间 /  命名空间
    targetNamespace :  目标名称空间 。 下面定义的那些元素都与这个名称空间绑定上。 
    elementFormDefault : 元素的格式化情况。  -->
<schema xmlns="http://www.w3.org/2001/XMLSchema" 
        targetNamespace="http://www.itheima.com/teacher" 
        elementFormDefault="qualified">

    <element name="teachers">
        <complexType>
            <sequence maxOccurs="unbounded">
                <!-- 这是一个复杂元素 -->
                <element name="teacher">
                    <complexType>
                        <sequence>
                            <!-- 以下两个是简单元素 -->
                            <element name="name" type="string"></element>
                            <element name="age" type="int"></element>
                        </sequence>
                    </complexType>
                </element>
            </sequence>
        </complexType>
    </element>
</schema>

被约束文件

<?xml version="1.0" encoding="UTF-8"?>
    <!-- xmlns:xsi : 这里必须是这样的写法,也就是这个值已经固定了。
    xmlns : 这里是名称空间,也固定了,写的是schema里面的顶部目标名称空间
    xsi:schemaLocation : 有两段: 前半段是名称空间,也是目标空间的值 , 后面是约束文档的路径。-->
    <teachers xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
              xmlns="http://www.itheima.com/teacher"
              xsi:schemaLocation="http://www.itheima.com/teacher teacher.xsd">
        <teacher>
            <name>zhangsan</name>
            <age>19</age>
        </teacher>
        <teacher>
            <name>lisi</name>
            <age>29</age>
        </teacher>
        <teacher>
            <name>lisi</name>
            <age>29</age>
        </teacher>
    </teachers>

命名空间

一个xml如果想指定它的约束规则, 假设使用的是DTD ,那么这个xml只能指定一个DTD , 不能指定多个DTD 。 但是如果一个xml的约束是定义在schema里面,并且是多个schema,那么是可以的。简单的说: 一个xml 可以引用多个schema约束。 但是只能引用一个DTD约束。

名称空间的作用就是在 写元素的时候,可以指定该元素使用的是哪一套约束规则。 默认情况下 ,如果只有一套规则,那么都可以这么写

<name>张三</name>
<!-- 添加前缀来避免命名冲突 -->
<aa:name></aa:name>
<bb:name></bb:name>

<!-- 使用命名空间 默认命名空间不需要加命名空间前缀-->
<!-- xmlns:命名空间前缀="命名空间的URL" -->
<h:table xmlns:h="http://www.w3.org/TR/html4/">
   <h:tr>
   <h:td>Apples</h:td>
   <h:td>Bananas</h:td>
   </h:tr>
</h:table>
<f:table xmlns:f="http://www.w3school.com.cn/furniture">
   <f:name>African Coffee Table</f:name>
   <f:width>80</f:width>
   <f:length>120</f:length>
</f:table>


©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,530评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 86,403评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,120评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,770评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,758评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,649评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,021评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,675评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,931评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,659评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,751评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,410评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,004评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,969评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,042评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,493评论 2 343

推荐阅读更多精彩内容