(2)Sax(Simple API for XML)解析

1.sax的解析过程

为了更加形象的理解sax的解析流程,于是从官网摘录出下面的图形


image.png

从图中可以看出SaxParese解析器包装了一个saxReader阅读器,当SaxParese的parsse方法被调用时, ContentHandler, ErrorHandler, DTDHandler, EntityResolver的接口的具体的实现注册到SaxReader中,这些具体实现类中的方法会被回调,这里感觉就像观察者模式,实现了观察者和被观察者的松度耦合,观察者可以是ErrorHandler的接口的具体实现也可以是DtdHandler的接口的实现,等到了具体的解析流程到了哪一步骤,就会自动通知调用具体的接口,又有点像模板方法,解析流程是固定的流程,具体的实现细节有实现了接口的子类来决定。

SAXParserFactory: 有系统属性决定创建解析器

SAXParser : SAXParser定义了集中parser的接口,将xml数据源和具体的DefaultHandler 给解析器,就会在xml处理过程中调用具体的处理方法

SAXReader :SAXParser包含了SAXReader,可以通过SAXParser.getXMlReader得到阅读器对象,可以对SAXReader进行接口的配置,比如配置ContentHandler的具体实现。

DefaultHandler: ContentHandler, ErrorHandler, DTDHandler, and EntityResolver接口的空实现,你可以继承这个类,对其中的方法进行覆盖。

ContentHandler:startDocument, endDocument, startElement, endElement 等方法在xml标签被识别时会自动调用,这个接口还定义了方法characters()和processingInstruction(),它们分别在解析器遇到XML元素或内联处理指令中的文本时调用。

ErrorHandler: 方法error()、fatalError()和warning()在响应各种解析错误时被调用。默认错误处理程序为致命错误抛出异常,并忽略其他错误(包括验证错误)。这就是您需要了解SAX解析器的原因之一,为了确保正确的处理,您需要向解析器提供您自己的错误处理程序

DTDHandler:定义通常不会调用的方法。在处理DTD时用于识别未解析实体的声明并对其进行操作

EntityResolver:当解析器必须标识由URI标识的数据时,将调用resolveEntity方法。在大多数情况下,URI只是一个URL,它指定文档的位置,但在某些情况下,文档可能由URN标识——web空间中唯一的公共标识符或名称。除了URL之外,还可以指定公共标识符。然后,EntityResolver可以使用公共标识符而不是URL来查找文档——例如,如果存在文档,则访问文档的本地副本。(可以用这个接口来验证xml的文档的元素是否正确,根据URL来转换为具体的xsd,dtd的文件的具体位置dom解析的内容会给出这一块内容)

2.具体的实例

要求:先给出一个Person.xml的文件,要通过java的sax解析出该内容,并封装到People这个对象中,并打印出解析的内容

  • 具体的Person.xml文件内容如下
<?xml version="1.0" encoding="UTF-8"?>
<PeopleList>
    <People id="1">
        <Name en='zhangsan'>张三</Name>
        <Age>20</Age>
    </People>
    <People id="2">
        <Name en='lisi'>李四</Name>
        <Age>30</Age>
    </People>
</PeopleList>
  • 对应的People实体如下:
public class People {
    private String id;
    private String name;
    private String englishName;
    private String age;
    public String getId() {
        return id;
    }
    public void setId(String id) {
        this.id = id;
    }
    public String getName() {
        return name;
    }
    public void setName(String name) {
        this.name = name;
    }
    public String getEnglishName() {
        return englishName;
    }
    public void setEnglishName(String englishName) {
        this.englishName = englishName;
    }
    public String getAge() {
        return age;
    }
    public void setAge(String age) {
        this.age = age;
    }
}
  • 具体的解析程序(重点理解sax是基于事件驱动的,通过回调来实现解析的
import java.io.File;
import java.io.FileInputStream;
import java.util.ArrayList;
import java.util.List;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

/**
 * sax 解析示例
 */
public class SaxXML {
    public static void main(String[] args) {
        File file = new File("D:\\Eclipse2018Data\\personProject\\jdk\\java-jaxp\\src\\main\\java\\com\\java\\jaxp\\sax\\Person.xml");
        try {
            SAXParserFactory spf = SAXParserFactory.newInstance();
            SAXParser parser = spf.newSAXParser();
            SaxHandler handler = new SaxHandler("People");
            //给SAXParser设置xml的数据源和DefaultHandler的具体实现
            parser.parse(new FileInputStream(file), handler);
            List<People> peopleList = handler.getPeoples();
            //打印内容
            for(People people : peopleList){
                System.out.println(people.getId()+"\t"+people.getName()+"\t"+people.getEnglishName()+"\t"+people.getAge());
            }
        } catch (Exception e) {
            e.printStackTrace();
        }
    }

}
//SaxHandler 默认实现了DefaultHandler 接口,这个DefaultHandler接口实现了四个接口
class SaxHandler extends DefaultHandler {
    private List<People> peoples = null;
    private People people;
    private String currentTag = null;
    private String currentValue = null;
    private String nodeName = null;

    public List<People> getPeoples() {
        return peoples;
    }

    public SaxHandler(String nodeName) {
        this.nodeName = nodeName;
    }


    //  当读到一个开始标签的时候,会触发这个方法
    @Override
    public void startDocument() throws SAXException {
        super.startDocument();
        //创建一个pesples的数组对象
        peoples = new ArrayList<People>();
    }

    //当文档解析的时候,会触发这个方法
    @Override
    public void endDocument() throws SAXException {
        super.endDocument();
    }
    // 当遇到元素标签的时候,调用这个方法
    @Override
    public void startElement(String uri, String localName, String name,
            Attributes attributes) throws SAXException {
        super.startElement(uri, localName, name, attributes);
        //判断是否有People这个元素,有则创建People对象
        if (name.equals(nodeName)) {
            people = new People();
        }
        //People标签的属性是否为null
        if (attributes != null && people != null) {
            for (int i = 0; i < attributes.getLength(); i++) {
                if(attributes.getQName(i).equals("id")){
                    //获取People标签的属性为id的值
                    people.setId(attributes.getValue(i));
                }
                else if(attributes.getQName(i).equals("en")){
                    people.setEnglishName(attributes.getValue(i));
                }
            }
        }
        //给currentTag赋值
        currentTag = name;
    }
    //  这个方法用来处理在XML文件中读到的内容
    @Override
    public void characters(char[] ch, int start, int length)
            throws SAXException {
        super.characters(ch, start, length);
        if (currentTag != null && people != null) {
            //得到标签体的内容
            currentValue = new String(ch, start, length);
            if (currentValue != null && !currentValue.trim().equals("") && !currentValue.trim().equals("\n")) {
                if(currentTag.equals("Name")){
                    people.setName(currentValue);
                }
                else if(currentTag.equals("Age")){
                    people.setAge(currentValue);
                }
            }
        }
        currentTag = null;
        currentValue = null;
    }

    //在遇到结束标签的时候,调用这个方法
    @Override
    public void endElement(String uri, String localName, String name)
            throws SAXException {
        super.endElement(uri, localName, name);
        if (name.equals(nodeName)) {
            peoples.add(people);
        }
    }

}
  • 输出结果为:
1   张三  zhangsan    20
2   李四  lisi    30
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,133评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,682评论 3 390
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,784评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,508评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,603评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,607评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,604评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,359评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,805评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,121评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,280评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,959评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,588评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,206评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,442评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,193评论 2 367
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,144评论 2 352

推荐阅读更多精彩内容

  • 新增链接http://m.blog.csdn.net/article/details?id=7305068,这一篇...
    来个芒果阅读 1,364评论 0 1
  • Python 面向对象Python从设计之初就已经是一门面向对象的语言,正因为如此,在Python中创建一个类和对...
    顺毛阅读 4,213评论 4 16
  • Python XML解析 作者:杨梦鸽 校对:翟舒青 什么是XML? XML 指可扩展标记语言(eXtensibl...
    木易林1阅读 853评论 1 4
  • Python的面向对象 类 Class 类变量 Class variable 数据成员 Data member 函...
    JasonJe阅读 1,120评论 0 3
  • 喜欢建盏,是从喜欢她那变化多端的色泽开始,千人千面,建盏是一个有个性的存在,因为千杯千面。所以在芸芸众盏中,...
    刘会专阅读 1,172评论 0 1