XML解析方式:sax、pull 、dom

Sax

定义

SAX全称是Simple API for Xml,既是指一种接口,也是一个软件包 。作为接口,sax事件驱动型xml解析的一个标准接口。是一个解析速度快并且占用内存少的xml解析器

Sax特点
  • 解析效率高,占用内存少
  • 可以随时停止解析
  • 不能载入整个文档到内存
  • 不能写入xml
  • SAX解析xml文件采用的是事件驱动
  • sax并不需要解析完 整个文档,在按内容顺序解析文档的过程中,sax会判断当前读到的字符是否合法xml语法中的某部分,如果符合就会触发事件
Sax工作原理

Sax的工作原理简单的说,就是对文档进行顺序扫描,扫描到文档(document)开始与结束,扫描到元素(element)开始、结束等地方时调用事件处理函数做相应动作,然后继续扫描,直到文档结束。

Sax解析文档过程
  • 继承DefaultHandler ,并实现方法
  • 创建SAX解析器工厂
  • 获得解析器
  • 获得输入流
  • 使用输入流,和实现接口作参数,调用解析器的解析方法进行解析

DefaultHandler接口是实现ContentHandler接口
ContentHandler接口中的常用方法:

  • startDocument() 当遇到文档开头的时候,调用这个方法,可以在其中做一些与准备工作
  • endDocument()当文档结束的时候,调用这个方法,可以在其中做一些善后工作
  • startElement(String namespaceURL, String localName, String qName, Attributes atts)当读到一个开始标签的时候,会触发这个方法。namespaceURL就是命名空间,localName是不带命名空间前缀的标签名,qName是待命名空间前缀的标签名。通过atts可以得到所有的属性名和相应的值。
  • endElement(String uri, String localName, String name)当遇到结束标签的时候,调用这个方法
  • characters(char[] ch, int start, int length)这个方法用来处理在xml文件中读到的内容,第一个参数为文件的字符串内容,后面两个参数是读到的字符串在这个数组中的起始位置和长度,使用new String(ch, start, length)就可以获取内容

DOM

简介

DOM全称Document Object Model,为xml文档的已解析版本定义了一组接口。解析器读入整个文档,然后构建一个主流内存的树结构,然后代码就可以使用DOM接口来操作这个树结构

DOM的特点
  • 整个文档树在内存中,便于操作;支持删除、修改、重新排列等多种功能
  • 通过树形结构存取xml文档
  • 可以在树的某个节点上向前或向后移动
  • 将整个文档调入内存(包括无用的节点),浪费时间和空间
DOM解析步骤
  • 创建解析器工厂
  • 获得解析器工厂
  • 接受一个xml文档作为输入参数名,并得到一个xml的文档对象(Document
  • 操作文档对象

适用场合: 一旦解析了文档还需多次访问这些数据;硬件资源充足(内存,cpu)

pull解析

pull解析器简介

pull解析器是android内置的解析器,基于事件驱动型的,解析原理与sax类似。 如:开始元素和结束元素事件,使用parse.next()可以进入下一个元素并触发相应的事件,事件将作为数值代码被发送,因此可以使用一个switch对感兴趣的事件进行处理。当元素开始解析时,调用parser.nextText()方法获取下一个类型节点的值

pull与sax的不同之处
  • pull读取xml文件后触发相应的事件调用方法返回的是数字。
  • pull解析中可以停止(可以在程序中控制,想解析到哪里就可以停止到哪里)
  • Android中更推荐使用pull解析
pull解析步骤
  • 创建解析器对象XmlPullParser paser = Xml.newPullParser();
  • 进行解析paser.setInput(input,"utf-8");
  • 产生第一个解析事件int eventType = paser.getEventType();
  • 可以使用循环判断是否继续解析while(eventType!=XmlPullParser.END_DOCUMENT){}
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容