Sax
定义
SAX
全称是Simple API for Xml
,既是指一种接口,也是一个软件包 。作为接口,sax
是事件驱动型xml
解析的一个标准接口。是一个解析速度快并且占用内存少的xml
解析器
Sax特点
- 解析效率高,占用内存少
- 可以随时停止解析
- 不能载入整个文档到内存
- 不能写入
xml
-
SAX
解析xml
文件采用的是事件驱动 -
sax
并不需要解析完 整个文档,在按内容顺序解析文档的过程中,sax
会判断当前读到的字符是否合法xml
语法中的某部分,如果符合就会触发事件
Sax工作原理
Sax的工作原理简单的说,就是对文档进行顺序扫描,扫描到文档(document)开始与结束,扫描到元素(element)开始、结束等地方时调用事件处理函数做相应动作,然后继续扫描,直到文档结束。
Sax解析文档过程
- 继承DefaultHandler ,并实现方法
- 创建SAX解析器工厂
- 获得解析器
- 获得输入流
- 使用输入流,和实现接口作参数,调用解析器的解析方法进行解析
DefaultHandler
接口是实现ContentHandler
接口
ContentHandler
接口中的常用方法:
-
startDocument()
当遇到文档开头的时候,调用这个方法,可以在其中做一些与准备工作 -
endDocument()
当文档结束的时候,调用这个方法,可以在其中做一些善后工作 -
startElement(String namespaceURL, String localName, String qName, Attributes atts)
当读到一个开始标签的时候,会触发这个方法。namespaceURL
就是命名空间,localName
是不带命名空间前缀的标签名,qName
是待命名空间前缀的标签名。通过atts
可以得到所有的属性名和相应的值。 -
endElement(String uri, String localName, String name)
当遇到结束标签的时候,调用这个方法 -
characters(char[] ch, int start, int length)
这个方法用来处理在xml
文件中读到的内容,第一个参数为文件的字符串内容,后面两个参数是读到的字符串在这个数组中的起始位置和长度,使用new String(ch, start, length)
就可以获取内容
DOM
简介
DOM
全称Document Object Model
,为xml
文档的已解析版本定义了一组接口。解析器读入整个文档,然后构建一个主流内存的树结构,然后代码就可以使用DOM
接口来操作这个树结构
DOM的特点
- 整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能
- 通过树形结构存取
xml
文档 - 可以在树的某个节点上向前或向后移动
- 将整个文档调入内存(包括无用的节点),浪费时间和空间
DOM解析步骤
- 创建解析器工厂
- 获得解析器工厂
- 接受一个
xml
文档作为输入参数名,并得到一个xml
的文档对象(Document
) - 操作文档对象
适用场合: 一旦解析了文档还需多次访问这些数据;硬件资源充足(内存,cpu)
pull解析
pull解析器简介
pull
解析器是android
内置的解析器,基于事件驱动型的,解析原理与sax
类似。 如:开始元素和结束元素事件,使用parse.next()
可以进入下一个元素并触发相应的事件,事件将作为数值代码被发送,因此可以使用一个switch
对感兴趣的事件进行处理。当元素开始解析时,调用parser.nextText()
方法获取下一个类型节点的值
pull与sax的不同之处
-
pull
读取xml
文件后触发相应的事件调用方法返回的是数字。 -
pull
解析中可以停止(可以在程序中控制,想解析到哪里就可以停止到哪里) -
Android
中更推荐使用pull
解析
pull解析步骤
- 创建解析器对象
XmlPullParser paser = Xml.newPullParser();
- 进行解析
paser.setInput(input,"utf-8");
- 产生第一个解析事件
int eventType = paser.getEventType();
- 可以使用循环判断是否继续解析
while(eventType!=XmlPullParser.END_DOCUMENT){}