Sax
定义
SAX全称是Simple API for Xml,既是指一种接口,也是一个软件包 。作为接口,sax是事件驱动型xml解析的一个标准接口。是一个解析速度快并且占用内存少的xml解析器
Sax特点
- 解析效率高,占用内存少
- 可以随时停止解析
- 不能载入整个文档到内存
- 不能写入
xml -
SAX解析xml文件采用的是事件驱动 -
sax并不需要解析完 整个文档,在按内容顺序解析文档的过程中,sax会判断当前读到的字符是否合法xml语法中的某部分,如果符合就会触发事件
Sax工作原理
Sax的工作原理简单的说,就是对文档进行顺序扫描,扫描到文档(document)开始与结束,扫描到元素(element)开始、结束等地方时调用事件处理函数做相应动作,然后继续扫描,直到文档结束。
Sax解析文档过程
- 继承DefaultHandler ,并实现方法
- 创建SAX解析器工厂
- 获得解析器
- 获得输入流
- 使用输入流,和实现接口作参数,调用解析器的解析方法进行解析
DefaultHandler接口是实现ContentHandler接口
ContentHandler接口中的常用方法:
-
startDocument()当遇到文档开头的时候,调用这个方法,可以在其中做一些与准备工作 -
endDocument()当文档结束的时候,调用这个方法,可以在其中做一些善后工作 -
startElement(String namespaceURL, String localName, String qName, Attributes atts)当读到一个开始标签的时候,会触发这个方法。namespaceURL就是命名空间,localName是不带命名空间前缀的标签名,qName是待命名空间前缀的标签名。通过atts可以得到所有的属性名和相应的值。 -
endElement(String uri, String localName, String name)当遇到结束标签的时候,调用这个方法 -
characters(char[] ch, int start, int length)这个方法用来处理在xml文件中读到的内容,第一个参数为文件的字符串内容,后面两个参数是读到的字符串在这个数组中的起始位置和长度,使用new String(ch, start, length)就可以获取内容
DOM
简介
DOM全称Document Object Model,为xml文档的已解析版本定义了一组接口。解析器读入整个文档,然后构建一个主流内存的树结构,然后代码就可以使用DOM接口来操作这个树结构
DOM的特点
- 整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能
- 通过树形结构存取
xml文档 - 可以在树的某个节点上向前或向后移动
- 将整个文档调入内存(包括无用的节点),浪费时间和空间
DOM解析步骤
- 创建解析器工厂
- 获得解析器工厂
- 接受一个
xml文档作为输入参数名,并得到一个xml的文档对象(Document) - 操作文档对象
适用场合: 一旦解析了文档还需多次访问这些数据;硬件资源充足(内存,cpu)
pull解析
pull解析器简介
pull解析器是android内置的解析器,基于事件驱动型的,解析原理与sax类似。 如:开始元素和结束元素事件,使用parse.next()可以进入下一个元素并触发相应的事件,事件将作为数值代码被发送,因此可以使用一个switch对感兴趣的事件进行处理。当元素开始解析时,调用parser.nextText()方法获取下一个类型节点的值
pull与sax的不同之处
-
pull读取xml文件后触发相应的事件调用方法返回的是数字。 -
pull解析中可以停止(可以在程序中控制,想解析到哪里就可以停止到哪里) -
Android中更推荐使用pull解析
pull解析步骤
- 创建解析器对象
XmlPullParser paser = Xml.newPullParser(); - 进行解析
paser.setInput(input,"utf-8"); - 产生第一个解析事件
int eventType = paser.getEventType(); - 可以使用循环判断是否继续解析
while(eventType!=XmlPullParser.END_DOCUMENT){}