XML学习笔记


一. XML的概念

    XML:eXtensible Markup Language,可扩展标记语言。

    可扩展的含义就是可以自己定义标签

    XML指可扩展标记语言,是独立于软件和硬件的信息传输工具;它是一种标记语言,很类似 HTML;XML的设计宗旨是传输数据,而非显示数据;XML标签没有被预定义,需要自行定义标签;XML被设计为具有自我描述性;XML是 W3C 的推荐标准。


二.XML的作用

    XML专用于保存或者传输(交换)数据

    保存数据可以体现在两个方面:① 配置文件,比如各种软件的配置文件;② 小型的数据库。

    传输(交换)数据体现在两个方面:① Ajax,“Asynchronous Javascript And XML”(异步 JavaScript 和 XML),现在json用的比较多;② Web service:web 服务 (xml最擅长的地方)。

    XML的新的应用

    svg(可缩放矢量图形):可缩放矢量图形是基于可扩展标记语言,用于描述二维矢量图形的一种图形格式。SVG 使用 XML 格式定义图形。


三.XML的结构

XML结构

    每个xml稳定,都有一个声明。

    整个XMl,是树形结构,有且仅有一个根节点

    在这个树形结构,有三个节点,元素节点 + 属性节点 + 文本节点。


四.XML的语法

    (一)语法总则

    1,必须以XML声明开头;

声明

        version:版本号,目前推荐是1.0;encoding:编码,字符集,建议使用utf-8。

        需要注意的是字符集,如果有乱码,肯定字符集设置不对的。保证你声明的字符集和文件本身保存的字符集的一致。

    2,必须拥有唯一的根元素;

    3,开始标签必须与结束标签相匹配;

    4,元素对大小写敏感,严格区分大小写;

    5,所有的元素都必须关闭,注意单标签;

    6,所有的元素都必须正确地嵌套

    7,必须对特殊字符使用实体

    (二)命名规则

    由于我们的xml中,所有的标签都需要自己定义:

    1,名称可以含字母、数字以及其他的字符

    2,名称不能以数字或者标点符号开始

    3,名称不能以字符“xml”(或者 XML、Xml)开始

    4,名称不能包含空格

    5,可使用任何名称,没有保留的字词。

    建议,使用php的命名方式,尽量使用数字、字母、下划线的组合。Xml支持中文。(但一般不用)

    注意:① 避免"-"字符。如:"first-name",一些软件会认为你需要提取第一个单词。

               ② 避免"."字符。如:"first.name",一些软件会认为 "name" 是对象 "first" 的属性。

               ③ 避免":"字符。冒号会被转换为命名空间来使用。

    (三)元素节点 + 属性节点 + 文本节点

        1,定义元素节点

        类似html:    <元素名>内容</元素名>

        2,定义属性

        类似html:    <元素名 属性名=‘属性值’>内容</元素名>

        注意:①属性值必须被引号包围,不过单引号和双引号均可使用;

        ② 一个元素可以有多个属性;

        ③ 元素中的属性是不允许重复的;

        ④ 标签属性所代表的信息也可以被改成用子元素的形式来描述,但是属性一般描述与数据无关的信息,比如 id,与数据相关的信息一般用子元素来描述。

    (四)实体引用

    相当于转义:有5个预定义的实体

预定义的实体

                    批量转义

实体应用
显示效果

    (五)注释

        与html相同:<!-- 注释内容-->

        注意,文档声明一定要放在最开头。之前不要有任何东西。


五.DTD验证 

    (一)概念

    XML的主要作用是 保存 和 传输数据,在传输的过程中,传输方和接受方 需要遵循一个规则,XML是需要通过这个规则的验证的。

    XML验证是指使用XML验证技术来检测我们的XML文档是否合理(合法)。

    XML通过验证的方式有两种:

    ① DTD:Document Type Definition,文档类型定义,目前使用最多的一种

    ② Schema:XSD,Xml Schema Definition,文档结构定义,是DTD的替代者。

    DTD用来验证我们的xml是否符合它的定义,要满足以下要求

    ① 格式良好的文档:语法正确文档;

    ② 合法的文档:在语法正确的基础之上,符合某个规范的xml文档。

    (二)DTD表现形式

        DTD一般书写于声明下面。

        DTD有两种引用方式:①在xml文档中直接定义;②外部定义,然后引用。

DTD

        验证方式:在线验证(http://validator.w3.org/);

在线验证

   归纳DTD的作用:

      ① 通过DTD,可一致地使用某个标准的 DTD 来交换数据;

      ② 可使用某个标准的DTD来验证从外部接收到的数据;

      ③ 可以使用DTD来验证自身的数据。

  注意事项:

    ① DTD描述了XML文档有哪些节点、节点之间的关系以及节点的值等。学习重点

    ② DTD验证的不是语法而是验证XML文档中应该有哪些节点,节点之间的关系是什么,元素的值、属性的值应该由什么内容组成

    ③ XML没有DTD,可以正常工作,但不能很好的工作。

    ④ 合法的XML文档是“形式良好”的 XML 文档,且遵守文档类型定义 (DTD) 的语法规则。

   (三)DTD定义

    DTD的构成:元素声明 + 属性声明 + 实体声明;

    ① 元素定义

        元素声明由三部分构成:ELEMENT声明 +  元素名 + 元素内容模型 ---定义了可允许的元素内容

        形式:<!ELEMENT 元素名 (元素内容描述)>

        注意:中间有空格。

        元素的表现形式有一下几种:

        {1} 仅包含元素的元素

            通常有两种结构:① 顺序结构,直接用逗号分隔开;② 选择结构,用 | 分隔,表示二者只能选择其一

 顺序结构

        表示:每个元素都要出现,并且只能出现一次,还要按照顺序依次出现

选择结构

        表示:二者只能出现其中的一个,且必须出现一个

        如果元素多次出现,使用数量词:* 任意个,包括0;至少一个,至多不限;?  0或1个

        {2}仅包含文本的元素

仅包含文本的元素

         {3}包含文本和元素的元素

包含文本和元素的元素

        [注意]:在DTD文件内部定义混合内容模型,必须要使用选择组合,#PCDATA关键字必须出现在子元素列表的第一个位置,且必须要使用*

        {4}空元素

            直接使用empty

空元素

        {5}任意元素(不推荐)

            <!ELEMENT 元素名 ANY>


        ② 属性定义

            定义的属性格式:<!ATTLIST 元素名 属性名称 属性的类型 取值方式>

            常用属性类型:CDATA,值为字符数据(character data);(en1 | en2 |....),此值是枚举列表中的一个值;ID,值为唯一的id............

            常用取值方式:#REQUIRED,属性值是必须的;#IMPLIED,属性值不是必须的;#FIXED value,属性值时固定的。

示例
示例
示例
示例
示例

            固定的值不能更改。

            一次性定义多个属性的简写

示例

        关于取值类型,必须要设置

        如果没有固定值、又没有默认值,而且也不是必须的,那么此时一定要声明为#IMPLIED


        ③ 实体定义    

            文本节点,本身是无需定义的。

            书写字符串的时候,有时候会重复使用某个的内容,此时为了方便,可以将其定义为实体。类似在编程中的变量的含义。

            DTD中,通常有两种实体:

            {1} 一般实体,在DTD中来定义的,然后在xml文档中来引用的

                定义格式:<!ENTITY 实体名称 值>

                引用:&实体名称;

一般实体
显示效果

            {2} 参数实体,只能是在外部DTD中来定义的,并且参数实体只能在DTD中引用的。

            在XML中引入DTD的语法格式:<!DOCTYPE 根元素名称 SYSTEM 'dtd路径'>

            定义格式:<!ENTITY % 实体名称 值>

            引用格式:%实体名称

示例
参数实体

            在浏览器中无法查看效果,应为浏览器不会加载外部DTD。


    六.DOM方式操作XML

            PHP操作XML常用方法

            ① DOM方式:所有语言都支持的方式,API相同            

            ② SimpleXML方式:php提供一种简单的方式

            {1} DOM的概念

            DOMDocument Object Model,文档对象模型。

            D:document,是指的文档本身,xml文档,HTML文档;

            O:Object,对象,是将元素、属性和文本等转成节点对象,对象有属性和方法,可以调用这些属性和方法完成相关的操作;

            M:Model,树模型,将Document转成一个树模型,节点,节点之间有关联。将这些节点转成对象。转换过程是在内存中进行的。

            {2} DOM操作XML步骤

XML
dom操作XML

            {3}DOM操作XML的CRUD

            1,查询

            如上图,方法  getElementsByTagName

            2,增加

            方法 createElement($name[,$value])

            方法 appendChild 增加子节点,与JS相同的

            有2个参数,仅创建元素,则仅需要第一个参数,为元素名称;创建包含文本的元素,就需要第二个参数,元素内的文本.

增加
效果

            3,更新

            直接操作文本节点

跟新
效果

            4,删除

            方法 removeChild(要删除的节点),需要父元素调用该方法。

            属性 parentNode 获得该元素的父节点

删除

        在删除节点的同时,不要对他进行foreach操作,比如上面的错误做法

        只需要将二者分开即可。先遍历,找到所有的节点,用到保存起来,然后再对他进行删除。

        注意使用PHP手册。


七.XPATH(查看手册)

        使用xpath,可以快速的定位到某个节点。使用xpath,可以快速的定位到某个节点。

        XPATH的主要作用就是增加查询的速度,就好像数据库中表的索引一样。

    ① 选取节点

        方式1.   /   从根节点选取       例如,/根节点

        方式2.  //   从匹配的当前节点选择文档中的节点,不论层次关系    例如,//文档中的节点

        方式3.  .    选取当前节点

        方式4. . .   选取当前节点的父节点   

        方式5.  @  选取属性

    ② 谓语

        谓语用来查找某个特定的节点或者包含某个指定的值的节点,谓语被嵌在方括号中。

        比如:    /根节点/子节点[ 谓语 ]

        谓语有:last(),position(),@属性名,@属性名=XX, 元素名>元素内文本节点的值,等等。

        在使用数量词,或者lastposition函数的时候,一定要注意,是针对同一个节点下面的元素。它们应该有共同的父节点。

    ③ 其他用法

        或 |     比如 //person/age  | //person/name   选取person元素的age和name 元素

        通配符 *  比如    //person/*  匹配person下的任何节点

实例

八.SimpleXML (查看手册)

        它是PHP专门提供的一种操作xml的简单方式,只能在php中使用

        基本上,就只有一个对象:SimpleXMLElement

            得到SimpleXMLElement的两种方式:

           ① 直接使用构造方法,传递的xml的内容,不是文件名

方式一

           ② 使用普通函数,传递的文件名,simplexml_load_file

方式二
显示结果

        对象均是 SimpleXML 对象,可以直接操作。

        使用方法:1.载入xml文档;

                          2.进行具体的处理;

                          3.保存结果。

        SimpleXML 操作XML的CRUD

                ① 增加   使用方法 addChild

 addChild

                ② 查询

                    根据显示结果,遍历即可

根据结果直接操作sxe对象

                ③修改

修改

                ④ 删除

                    unset 函数

删除

九.XML应用之Web Service

    web Service 的概念    

Web service是一个平台独立的,低耦合的,自包含的、基于可编程的web的应用程序,可使用开放的XML(标准通用标记语言下的一个子集)标准来描述、发布、发现、协调和配置这些应用程序,用于开发分布式的互操作的应用程序。

            本质就是通过网络调用其他网站的资源。

            web service三要素: SOAP ,WSDL,UDDI

        ① SOAP

            SOAP:Simple Object Access Protocol,简单对象访问协议。

            SOAP = XML + HTTP;

            PHP提供了操作SOAP的扩展,需要开启。

            在php.ini中,extension = php_soap.dll;

        ② WSDL

            WSDL:Web Service Description Language , web服务描述语言,就是XML文档。

        XML应用示例:使用 web service 查询航班

              主要难点在与XML文档结构的分析                

            API接口

            http://www.webxml.com.cn/zh_cn/web_services.aspx

wsdl就是xml文档

                点击第一个 Endpoint,进入下面页面

Endpoint页面

                    soapclient类

                    构造方法 ,需要传递一个wsdl 文件

                    public __construct( mixed $wsdl [, array $options ] )

获取城市列表
结果any属性是个XML文档

                有了 soapClient 对象,就可以调用 Endpoint 中 提供的 2个方法。

                使用simpleXML 进行操作

代码
html代码
html代码
结果
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,921评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,635评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,393评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,836评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,833评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,685评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,043评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,694评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,671评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,670评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,779评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,424评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,027评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,984评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,214评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,108评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,517评论 2 343

推荐阅读更多精彩内容