不熟悉xml的同学可以先阅读下面两篇帖子
xml基础
https://www.jianshu.com/p/f61953320a43
xml语法
https://www.jianshu.com/p/361a2cb6d3e5
XML解析中有两种解析思想:
pull解析
sax解析
注意是解析思想
本篇帖子讲解sax解析
与pull解析是把整个xml文档加载到内存中不同,sax解析是逐行解析xml文档的,其解析的过程并不需要把整个xml文档加载到内存当中去。
SAX的全称是Simple APIs for XML,也即XML简单应用程序接口。它并不是由W3C官方所提出的标准,可以说是“民间”的事实标准。实际上,它是一种社区性质的讨论产物。虽然如此,在XML中对SAX的应用丝毫不比DOM少,几乎所有的XML解析器都会支持它。与DOM不同,SAX提供的访问模式是一种顺序模式,这是一种快速读取XML数据的方式。当使用SAX分析器对XML文档进行分析时,会触发一系列事件,并激活相应的事件处理函数,应用程序通过这些事件处理函数实现对XML文档的访问,因而SAX接口也被称作事件驱动接口。
Sax解析过程:
1、解析器:逐行扫描XML文档
2、事件处理器:需要我们自己编写
举个例子:
Sax解析的优缺点:
优点:不需要等待整个xml文件加载到内存中,当解析到某一部分时自动触发到对应的方法去做处理
处理的效率比较高
占用内存比较小,无论多大的xml文件,理论上都可以解析
缺点:每次解析都只能处理一次,下次再想处理还需要重新解析
致命缺点:只能对xml文件做查询,不能做增删改操作!!!
注:本文依旧为普及Sax解析思想,并非具体的使用API,市面上有一些应用比较广泛的Sax解析框架,而且功能比较强大,但这并非本文的重点,感兴趣的同学可以自行研究一下。
与pull解析的简单比较
1、哪种解析方式更好?
额,这个有点难以回答,其实没有哪个更好或者更差,只能说哪个更适合。
2、哪种解析方式使用更多?
答案是sax解析。因为平时我们针对于xml更多的都只是查询动作,而新增和修改其实直接操作xml文档来的更加直观和快速。