XML解析(下)

StAX解析

除了DOM和SAX,还有一种解析XML文档的模式StAX。StAX的全称为The Stream API for XML。与SAX类似,StAX也是一边解析,一边处理,一边释放内存资源。
之所以将StAX与DOM、SAX分开来介绍,最重要的原因是,DOM和SAX都是推(PUSH)模式的解析模式,而StAX是拉(PULL)模式的解析模式(因此一般称StAX解析为XML Pull解析)。是推模式还是拉模式,取决于在解析的过程中谁处于主导地位,是服务器还是客户端。在推模式中,解析器自动解析XML文档而不受用户干预,但在拉模式中,用户可以主动控制解析的进行,也就是主动控制事件的处理,主动调用相应的方法。理解了什么是推模式和拉模式后,StAX解析的思想也不难理解:XML文档传递给解析器,通过next()方法触发文档解析事件,用户可以获取当前事件 ,也可以调用相应的方法 :

XML Pull解析原理

与SAX不同的是,XML Pull中用int型数据表示不同的事件:

XML Pull中不同的事件

如果想要查找龙族这本书的价格,代码为:

@Test
public void demo1() throws Exception {
    XmlPullParserFactory xppFactory = XmlPullParserFactory.newInstance();//构建解析器工厂
    XmlPullParser xpp = xppFactory.newPullParser();//构建解析器
    xpp.setInput(new FileInputStream("books.xml"), "utf-8");//将XML文档和XML文档的编码方式传递给解析器
    int event;
    boolean isFound = false;//定义boolean变量用于标记
    while ((event = xpp.getEventType()) != XmlPullParser.END_DOCUMENT) {//判断当前事件是否为文档结束事件
        if (event == XmlPullParser.START_TAG && xpp.getName().equals("name")) {//找到name元素
        String bookName = xpp.nextText();//获取name元素的文本内容
        if (bookName.equals("龙族")) {
            isFound = true;//若这本书为《龙族》,将标记变量isFound置为true
        }
        if (event == XmlPullParser.START_TAG && xpp.getName().equals("price") && isFound == true) {//利用标记变量检验price元素是否为所要找的
            System.out.println(xpp.nextText());//输出《龙族》的价格
            break;//跳出循环
        }
        xpp.next();// 触发下一事件
    }
}

用JUnit进行单体测试:

demo1()运行效果

结果是正确的。
当然还有一种更简单的方法,先通过name元素找到龙族这本书,再调用next()方法找到price元素,输出价格。代码实现相对容易,这里不再演示。
XML Pull解析还可以生成XML文档,这个过程又称为序列化。和单纯地解析XML文档相比,序列化的代码有所不同:

XmlPullParserFactory xppFactory = XmlPullParserFactory.newInstance();//构建解析器工厂
XmlSerializer xs = xppFactory.newSerializer();//构建序列化器
xs.setOutput(new FileOutputStream("books2.xml"), "utf-8");//将需要生成的XML文档和XML文档的编码方式传递给序列化器

下面生成一个简单的XML文档:

@Test
public void demo2() throws Exception {
    XmlPullParserFactory xppFactory = XmlPullParserFactory.newInstance();
    XmlSerializer xs = xppFactory.newSerializer();
    xs.setOutput(new FileOutputStream("personal_info.xml"), "utf-8");
    xs.startDocument("utf-8", true);//设置XML文档的编码格式和standalone属性
    xs.startTag(null, "personal_info");//为personal_info元素设置元素开始事件
    xs.startTag(null, "name");//为name元素设置元素开始事件
    xs.text("超哥");//为name元素设置文本元素事件
    xs.endTag(null, "name");//为name元素设置元素结束事件
    xs.endTag(null, "personal_info");//为personal_info元素设置元素结束事件
    xs.endDocument();//设置文档结束事件
}

用JUnit进行单体测试,格式化personal_info.xml文档后查看:

book2.xml

操作成功。
startTag()endTag()方法中,第一个参数为名称空间,一般为0null,建议整个Java程序中统一为0null
在XML Pull解析中有一个非常重要的思想:这种解析模式决定了在解析的过程中是不能对数据进行修改的,但如果不立即释放数据而是将其保存在内存中,那么就能对数据进行修改了。而对于这些数据,可以将它们封装成List集合对象:

XML Pull修改数据原理

对于文档books.xml,很显然数据是根据书来存放的,那么就可以定一个book类,类中定义nameauthorprice三个属性并生成GettersSetters方法 :

public class Book{
    private String name;
    private String author;
    private double price;
    public String getName(){
        return name;
    }
    public void setName(String name){
        this.name = name;
    }
    public String getAuthor(){
        return author;
    }
    public void setAuthor(String author){
        this.author = author;
    }
    public double getPrice(){
        return price;
    }
    public void setPrice(double price){
        this.price = price;
    }
}

再将数据序列化生成XML文档:

@Test
public void demo3() throws Exception{
    Book book = new Book();
    book.setName("天龙八部");
    book.setAuthor("金庸");
    book.setPrice(108.0);
    XmlPullParserFactory xppFactory = XmlPullParserFactory.newInstance();
    XmlSerializer xs = xppFactory.newSerializer();
    xs.setOutput(new FileOutputStream("books3.xml"), "utf-8");
    xs.startDocument("utf-8", true);
    xs.startTag(null, "books");
    xs.startTag(null, "book");
    xs.startTag(null, "name");
    xs.text(book.getName());
    xs.endTag(null, "name");
    xs.startTag(null, "author");
    xs.text(book.getAuthor());
    xs.endTag(null, "author");
    xs.startTag(null, "price");
    xs.text(String.valueOf(book.getPrice()));
    xs.endTag(null, "price");
    xs.endTag(null, "book");
    xs.endTag(null, "books");
    xs.endDocument();
}

用JUnit进行单体测试,格式化books3.xml文档后查看:

books3.xml

操作成功。
为了方便解析XML文档和序列化生成XML文档,可以定义一个工具类PullMethod,类中定义这两个方法(当然这个工具类只对book对象生效,可以根据XML文档的内容对类和方法进行修改):

public class PullMethod{
    public static List<Book> parseXMLtoList(String fileName) throws Exception{//接收XML文档,将文档中的数据封装成List集合对象
    List<Book> books = new ArrayList<Book>();
    Book book = null;
    XmlPullParserFactory xppFactory = XmlPullParserFactory.newInstance();
    XmlPullParser xpp = xppFactory.newPullParser();
    xpp.setInput(new FileInputStream(fileName), "utf-8");
    int event;
    while ((event = xpp.getEventType()) != XmlPullParser.END_DOCUMENT){
        if (event == XmlPullParser.START_TAG && xpp.getName().equals("book")){
            book = new Book();定义Book类对象book
        }
        if (event == XmlPullParser.START_TAG && xpp.getName().equals("name")){
            book.setName(xpp.nextText());//为book设置name属性
        }
        if (event == XmlPullParser.START_TAG && xpp.getName().equals("author")){
            book.setAuthor(xpp.nextText());//为book设置author属性
        }
        if (event == XmlPullParser.START_TAG && xpp.getName().equals("price")){
            book.setPrice(Double.parseDouble(xpp.nextText()));//为book设置price属性
        }
        if (event == XmlPullParser.END_TAG && xpp.getName().equals("book")){
            books.add(book);//将book添加至集合中
        }
        xpp.next();
     }
     return books;//返回List集合对象
     }
    public static void serializeListtoXML(List<Book> books, String fileName) throws Exception{//接收List集合对象,将集合对象序列化成XML文档
        XmlPullParserFactory xppFactory = XmlPullParserFactory.newInstance();
        XmlSerializer xs = xppFactory.newSerializer();
        xs.setOutput(new FileOutputStream(fileName), "utf-8");
        xs.startDocument("utf-8", true);
        xs.startTag(null, "books");
        for (Book book : books){//foreach语句遍历集合
            xs.startTag(null, "book");
            xs.startTag(null, "name");
            xs.text(book.getName());
            xs.endTag(null, "name");
            xs.startTag(null, "author");
            xs.text(book.getAuthor());
            xs.endTag(null, "author");
            xs.startTag(null, "price");
            xs.text(String.valueOf(book.getPrice()));
            xs.endTag(null, "price");
            xs.endTag(null, "book");
        }
        xs.endTag(null, "books");
        xs.endDocument();
    }   
}

可以这样测试这两个方法是否正确:

@Test
public void demo4() throws Exception{
    List<Book> books = PullMethod.parseXMLtoList("books.xml");
    PullMethod.serializeListtoXML(books, "books3.xml");
}

原理很简单,就是将books.xml文档先解析再生成,如果序列化后的文档和原文档完全一样,则证明工具类中的两个方法是正确的:

books3.xml

有了工具类的两个方法,就能够很方便地对XML文档中的数据进行修改了:

@Test
public void demo5() throws Exception{//增加数据
    List<Book> books = PullMethod.parseXMLtoList("books.xml");
    Book book = new Book();
    book.setName("三国演义");
    book.setAuthor("罗贯中");
    book.setPrice(39.6);
    books.add(book);
    PullMethod.serializeListtoXML(books, "books3.xml");
}
book3.xml
@Test
public void demo6() throws Exception{//修改数据
    List<Book> books = PullMethod.parseXMLtoList("books.xml");
    for(Book book:books){
        if(book.getName().equals("三体")){
            book.setPrice(book.getPrice() * 0.5);
        }
    }
    PullMethod.serializeListtoXML(books, "books3.xml");
}
books3.xml
@Test
public void demo7() throws Exception{//删除数据
    List<Book> books = PullMethod.parseXMLtoList("books.xml");
    for(Book book:books){
        if(book.getName().equals("三体")){
            books.remove(book);//从集合中删除book
            break;
        }
    }
    PullMethod.serializeListtoXML(books, "books3.xml");
}
books3.xml

学习提示

这就是XML的三种解析模式,无论是DOM、SAX还是StAX,实际上都不难掌握,关键是要记住各自的思想和解析时调用的方法。在学习的过程中一定要善于查阅API文档,这样才能更好地理解与运用它们。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,242评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,769评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,484评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,133评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,007评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,080评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,496评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,190评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,464评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,549评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,330评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,205评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,567评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,889评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,160评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,475评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,650评论 2 335

推荐阅读更多精彩内容