JSON与XML解析

JSON与XML解析

json 待整理


xml

基础常识

  • 原样输出内容: <![CDATA[ 内容内容 ]]>
  • 约束: dtd 和 schema (文件以 .xsd 结尾)
  • 引入css样式
  • xml版本 version

一 解析方式

1. DOM: 一次性将文本加载进内存,形成dom树

  • 优点: 操作方便,对文档可以进行CURD操作
  • 缺点: 占内存

2. SAX: 逐行读取,基于事件驱动,读取一行之后释放一行

  • 优点: 内存占用小
  • 缺点: 只能读取, 不能修改

二 xml解析器:

1. JAXP

  • 官方提供,但操作复杂

2. DOM4J

  • 很优秀的解析器

3. pull Android 内置解析器, SAX方式

4. jsoup

  • java的HTML解析器, 可以通过DOM, CSS和类似JQuery的方式操作
  • Jsoup 工具类,主要获取Document
  • Document 文档对象,代表树
  • Elements Element对象集合
  • Element 元素对象
  • Node 节点对象
jsoupUml.jpg

Xpath

// 测试代码
import cn.wanghaomiao.xpath.exception.XpathSyntaxErrorException;
import cn.wanghaomiao.xpath.model.JXDocument;
import cn.wanghaomiao.xpath.model.JXNode;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.util.List;

/**
 * xml 解析
 */
public class JsoupTest {

    public static void main(String[] args) throws IOException, XpathSyntaxErrorException {
        //   获取document对象
        String path = JsoupTest.class.getClassLoader().getResource("c3p0-config.xml").getPath();
        System.out.println("xml文件: " + path);
        Document document = getDocument(path);
        Elements elements = documentTest(document);
        elementTest(elements);

        System.out.println("Xpath 方式获取元素集合");
        JXDocument jxDocument = new JXDocument(document);
        List<JXNode> jxNodes  = jxDocument.selN("//property");
        for (JXNode jxNode : jxNodes) {
            // 可以转换为元素对象
            System.out.println(jxNode.getElement());
        }
    }

    /**
     * Jsoup 获取Document对象
     *
     * @param path xml 路径
     *
     * @return Document 文档操作对象
     *
     * @throws IOException
     */
    private static Document getDocument(String path) throws IOException {
        // 1. 根据文件流获取document
        File     file     = new File(path);
        Document document = Jsoup.parse(file, "UTF-8");

        // 根据字符串直接获取
        InputStream   in    = new FileInputStream(path);
        byte[]        bytes = new byte[1024];
        StringBuilder sb    = new StringBuilder();
        int           len   = 0;
        while ((len = in.read(bytes)) != -1) {
            sb.append(new String(bytes, 0, len));
        }

        Document document2 = Jsoup.parse(sb.toString());
        in.close();

        return document;
    }

    /**
     * document 对象操作方法
     * 类似JavaScript dom节点操作对象的方法
     *
     * @param document 文档对象
     *
     * @return Elements
     */
    private static Elements documentTest(Document document) {
        // 这三个方法是Document从Element对象继承来的, 从当前节点开始搜索
        System.out.println("根据标签名称获取点对应Element集合");
        Elements property = document.getElementsByTag("property");
        for (Element element : property) {
            System.out.println(element);
        }

        System.out.println("根据属性名称获取对应Element集合");
        Elements name = document.getElementsByAttribute("name");
        for (Element element : name) {
            System.out.println(element);
        }

        System.out.println("根据属性名和属性值获取对应Element集合");
        Elements name1 = document.getElementsByAttributeValue("name", "user");
        for (Element element : name1) {
            System.out.println(element);
        }

        System.out.println("selector 选择器选择 类似 Css选择器");
        Elements select = document.select("property[name=\"user\"]");

        return name;
    }

    /**
     * 元素对象集合
     *
     * @param elements 元素对象集合
     */
    private static void elementTest(Elements elements) {
        System.out.println("elementTest");
        for (Element element : elements) {
            System.out.println(" 1. 获取属性值");
            System.out.println(element.attr("name"));
            System.out.println("text 类似 text");
            System.out.println(element.text());
            System.out.println("html 类似 innerHtml");
            System.out.println(element.html());
        }
    }
}

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容