XML的解析技术

Xml解析方式分为两种:

1.dom
document object model 即文档对象模型,它是w3c组织推荐的解析xml的一种方式。

2.sax
simple api for xml 不是官方标准,它是xml 社区事实上的标准,几乎所有的xml解析器都支持它


Jaxp解析
Java api for xml programming 是sun公司的一套操作xml的API. Jaxp很好的支持了dom与sax解析方式。Jaxp开发包是javase的一部分,它是由javax.xml org.w3c.domoirg.xml.saq包及其子包组成
需要类:DocumentBuilderFactory
DocumentBuilder
Document element node 这三个属性是理解xml的关键类,分别指dom, 元素,<node> </node> 开头的内容

  • 要xml文件代码
<?xml version="1.0" encoding="UTF-8"?>

<bookstore>
    <book catgrory="computer">
        <title>java从入门到放弃</title>
        <author>王二</author>
        <year>1009</year>
        <price>43.5</price>
    </book>
    <book catgrory="story">
        <title>mysql从入门到放弃</title>
        <author>龙达</author>
        <year>2011</year>
        <price>23.5</price>
    </book>
    
</bookstore>
  • dom代码
    当出现了#text ........ 是由于文档间空格换行,需要写逻辑进行处理。
package org.dgw.net;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.NamedNodeMap;
import org.w3c.dom.Node;
import org.w3c.dom.NodeList;
import org.xml.sax.SAXException;

public class demo1 {
    public static void main(String[] args) throws ParserConfigurationException,
            FileNotFoundException, SAXException, IOException {
        // 构建dom解析工厂
        DocumentBuilderFactory dom = DocumentBuilderFactory.newInstance();
        // 得到解决对象
        DocumentBuilder builder = dom.newDocumentBuilder();
        // 拿到dom对象
        Document document = builder
                .parse(new FileInputStream(new File("d://xmldemo.xml")));
        // 获取根节点
        Element root = document.getDocumentElement();
        System.out.println(root.getNodeName());

        // 读取database节点NodeList接口提供对节点的有序集合的抽象
        NodeList nodeList = root.getElementsByTagName("book");
        for (int i = 0; i < nodeList.getLength(); i++) {
            // 获取一个节点
            Node node = nodeList.item(i);
            // 获取该节点所有属性
            NamedNodeMap attributes = node.getAttributes();
            for (int j = 0; j < attributes.getLength(); j++) {
                Node attribute = attributes.item(j);
                System.out.println(attribute.getNodeName() + ":"
                        + attribute.getNodeValue());
            }
            // 获取所有子节点数据
            NodeList childNodes = node.getChildNodes();
            for (int j = 0; j < childNodes.getLength(); j++) {
                Node childNode = childNodes.item(j);
                if (childNode.getNodeType()==Document.ELEMENT_NODE) {
                    System.out.println(childNode.getNodeName() + ":"
                            + childNode.getTextContent());
                }
            }
        }
    }
}

  • 生成一个简单文档

类:TransformerFactory Transformer DOMSource StreamResult

package org.xml.tech;

import java.io.File;

import javax.xml.parsers.DocumentBuilder;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;
import javax.xml.transform.Transformer;
import javax.xml.transform.TransformerConfigurationException;
import javax.xml.transform.TransformerException;
import javax.xml.transform.TransformerFactory;
import javax.xml.transform.TransformerFactoryConfigurationError;
import javax.xml.transform.dom.DOMSource;
import javax.xml.transform.stream.StreamResult;

import org.w3c.dom.Document;
import org.w3c.dom.Element;
import org.w3c.dom.Node;

public class domcreate {
    private static File file;
    private final static String path = "D://demo.xml";

    public static void main(String[] args) throws ParserConfigurationException,
            Exception, TransformerFactoryConfigurationError {
        DocumentBuilder builder = DocumentBuilderFactory.newInstance()
                .newDocumentBuilder();
        Document dom = builder.newDocument();
        // 标注xml信息
        dom.setXmlVersion("1.0");
        dom.setXmlStandalone(true);
        // 开始构建
        Element root = dom.createElement("root");
        root.setAttribute("lang", "zh");
        dom.appendChild(root);
        // 子节点
        Element book = dom.createElement("book");
        Element title = dom.createElement("title");
        String textContent = "hell wold";
        title.setTextContent(textContent);
        book.appendChild(title);
        root.appendChild(book);
        createXml(dom);

    }

    private static void createXml(Node dom)
            throws TransformerFactoryConfigurationError, TransformerException {
        Transformer transformer = TransformerFactory.newInstance()
                .newTransformer();
        DOMSource source = new DOMSource(dom);
        file = new File(path);
        StreamResult result = new StreamResult(file);
        transformer.transform(source, result);

    }
}


Sax解析
Sax是基于事件驱动(事件是预定义的,读到什么内容即可触发相关事件)的方式来对xml进行处理。Sax它只能进行读操作。它是读取一行解析一行。大的xml文档采用此读取方式,是不可往复的,不可逆的

相关类: SAXParserFactory SAXParser XMLReader ContentHandler DefaultHandler

package org.xml.tech;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.Attributes;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;
import org.xml.sax.helpers.DefaultHandler;

public class SaxDemo {
    public static void main(String[] args) throws ParserConfigurationException,
            SAXException, FileNotFoundException, IOException {
        SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
        XMLReader reader = parser.getXMLReader();
        reader.setContentHandler(new DefaultHandler() {

            @Override
            public void startDocument() throws SAXException {
                System.out.println("开始解析");
            }

            @Override
            public void endDocument() throws SAXException {
                System.out.println("结束解析");
            }

            @Override
            public void startElement(String uri, String localName, String qName,
                    Attributes attributes) throws SAXException {
                System.out.println("开始解析节点[" + qName + "]...");
                System.out.println("共有[" + attributes.getLength() + "]个属性");
            }

            @Override
            public void characters(char[] ch, int start, int length)
                    throws SAXException {
                // 内容解析
                /*
                 * String string = new String(ch, start, length);
                 * System.out.println(string);
                 */
                System.out.println(start);
                System.out.println(length);
                String string = new String(ch);
                System.out.println(string);

            }

            @Override
            public void endElement(String uri, String localName, String qName)
                    throws SAXException {
                System.out.println("结束解析XML节点...");
            }

        });
        // 文件源必须写在末尾
        reader.parse(
                new InputSource(new FileInputStream(new File("D://demo.xml"))));
    }

}


Dom4j介绍
Dom4j它是一个优秀操作xml的工具,在很开源的框架中大量使用dom4j, 例如Struts2 hibernate sping框架。dom4j是一个简单的开源库,用于处理XML、 XPath和XSLT,它基于Java平台,使用Java的集合框架,全面集成了DOM,SAX和JAXP,是目前比较流行XML文档解析方法。

要想使用dom4j必须下载dom4j jar包才可以使用。
链接:::http://www.dom4j.org/dom4j-1.6.1/

package org.xml.tech;

import java.io.FileOutputStream;
import java.util.List;

import org.dom4j.Attribute;
import org.dom4j.Document;
import org.dom4j.DocumentHelper;
import org.dom4j.Element;
import org.dom4j.io.OutputFormat;
import org.dom4j.io.SAXReader;
import org.dom4j.io.XMLWriter;

public class Dom4jHandler {
    public void add() throws Exception {
        // 1.创建一个Document
        Document document = DocumentHelper.createDocument();
        // 2.给Document添加数据
        Element root = document.addElement("DataSource");
        // 添加注释
        root.addComment("这是注释信息");
        // 在root根节点下面添加一个子节点
        Element database = root.addElement("database");
        database.addAttribute("name", "mysql");
        database.addAttribute("version", "5.0");
        // 添加子节点
        database.addElement("driver").setText("com.mysql.jdbc.Driver");
        database.addElement("url")
                .setText("jdbc:mysql://localhost:3306/myjdbc");
        database.addElement("user").setText("root");
        database.addElement("password").setText("root");
        // 3.将Document写出文件
        OutputFormat format = OutputFormat.createPrettyPrint();
        format.setEncoding("utf-8");
        // FileOutputStream默认生成的路径在根路径
        XMLWriter xw = new XMLWriter(new FileOutputStream("db.xml"), format);
        xw.write(document);
        xw.close();
    }

    public void update(String fileName) throws Exception {
        // sax解析器
        SAXReader saxReader = new SAXReader();
        // 读到对象
        Document document = saxReader
                .read(this.getClass().getResourceAsStream("/" + fileName));
        Element root = document.getRootElement();
        List<Element> databases_node = root.elements("database");
        for (Element database_node : databases_node) {
            if (database_node.attributeValue("name")
                    .equalsIgnoreCase("mysql")) {
                System.out
                        .println("old:" + database_node.attributeValue("name"));
                database_node.attribute("name").setText("Oracle");
                System.out.println(
                        "update:" + database_node.attributeValue("name"));

                database_node.element("driver").setText("oracel");
                database_node.element("url").setText("jdbc");

                // 删除password节点
                database_node.remove(database_node.element("password"));

                // 删除属性
                database_node.remove(database_node.attribute("version"));
            }
        }

        OutputFormat format = OutputFormat.createPrettyPrint();
        format.setEncoding("utf-8");
        // FileOutputStream默认生成的路径在根路径
        XMLWriter xw = new XMLWriter(new FileOutputStream("db2.xml"), format);
        xw.write(document);
        xw.close();
    }

    public void read(String fileName) throws Exception {
        // sax解析器
        SAXReader saxReader = new SAXReader();
        // 读到对象
        Document document = saxReader
                .read(this.getClass().getResourceAsStream("/" + fileName));
        Element root = document.getRootElement();
        System.out.println("根节点:" + root.getName());

        // List<Element> childElements=root.elements();
        List<Element> childElements = root.elements("database");
        for (Element child : childElements) {
            // 获取属性 不知道属性名称时的遍历方法
            List<Attribute> attributes = child.attributes();
            // for (Attribute attribute : attributes) {
            // System.out.println(attribute.getName()+":"+attribute.getValue());
            // }
            String name = child.attributeValue("name");
            // String version = child.attributeValue("version");
            String version = child.attribute("version").getValue();
            System.out.println(name + ":" + version);

            // //获取子节点
            // List<Element> childs=child.elements();
            // for (Element element : childs) {
            // System.out.println(element.getName()+":"+element.getText());
            // }
            System.out.println(child.elementText("driver"));
            System.out.println(child.element("url").getText());
            System.out.println(child.elementTextTrim("user"));
            System.out.println(child.element("password").getTextTrim());

        }
    }

    public static void main(String[] args) throws Exception {
        // new Dom4jHandler().read("data-source.xml");
        // new Dom4jHandler().add();
        new Dom4jHandler().update("data-source.xml");
    }
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,039评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,223评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,916评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,009评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,030评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,011评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,934评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,754评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,202评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,433评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,590评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,321评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,917评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,568评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,738评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,583评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,482评论 2 352

推荐阅读更多精彩内容