一:xml
1.与html相像,名字叫做 可扩展标记语言,作为接口语言使用的比较多
2.html : 标签事固定的,负责数据的展示 xml:标签可以自定义,负责数据的存储
xml示例:
3.html 与 xml的区别
.html侧重数据展示 ,xml侧重数据的存储
.html标签事固定的 xml标签是自己定义的
.html结构与样式结合在一起 xml结构与样式 是分开的
4.xml历史
xml一开始的出现是为了替换掉html,但是随着一些问题最后不了了之,但是也产生了xhtml(使用的是html的标签,xml的准则)
5。xml的作用
。可以当作小型的数据库使用(msg聊天工具通过xml文件在本地保留聊天记录信息),许多文件的配置文件也通过xml保留对应的信息
。可以在网站里面当作 接口 服务使用
。可以当作配置文件使用(例如在项目里面把数据库的 主机名 用户名 密码 在xml中配置好)
6.书写规范
。先声明一个处理指令
。文档的树状结构:必须有且只有一个根节点
。xml标签必须前后闭合,html不闭合也没事
。标签必须前后大小写一致
。属性全部是小写 属性的值必须使用引号引起来
。属性必须有值
。标签可以嵌套,但是不可以交叉
。特殊符号使用符号实体
。大段内容里面,特殊符号比较多,就把内容放在 < ! [ CDATA[ ] ]>中
7.xml标签名字组成部分
utf-8允许 汉字 当作标签名字,普通字符可以有 字母 数字 中恒线- 下划线_ 点. 数字不能用作首部。
二:xml案例 获取无广告视频
1.网站提供的服务有两种,第一种是大众服务,再就是网站信息接口xml服务。
比如搜狐的接口网站是 open.souhu.com
2.xml去广告基本原理
我们需要做的就是通过接口把网站的信息放到我们自己的网站中,这其中使用的就是xml。不是说了xml是用来存储数据的么。这个过程中广告就会去掉,只提供xml的网站核心内容。
本来想获取搜狐视频的无广告视频,但是有点懒就没在弄,在这里以 图灵机器人 为例简单的介绍一下。
其实都是一样的,客户端与服务器进行数据的交互 数据需要保存,有两种保存方式,一种是 json 再就是xml
这里使用的事图灵的提供的url,表单get请求,返回的是json数据,这个json就与xml一样,都是用来存储数据的,这是最原生的数据,未经过加工过的,所以就可以剔除掉广告的烦扰了
3.dom解析xml数据
返回的数据需要解析才能得到你自己想要的主要部分,就需要DOM解析。 看图
都是一些特定的函数方法,记住。