XML即可扩展标记语言(eXtensible Markup Language)。标记是指计算机所能理解的信息符号,通过此种标记,计算机之间可以处理包含各种信息的文章等。如何定义这些标记,既可以选择国际通用的标记语言,比如HTML,也可以使用象XML这样由相关人士自由决定的标记语言,这就是语言的可扩展性。XML是从SGML中简化修改出来的。它主要用到的有XML、XSL和XPath等。
XML是一种标记语言,很类似HTML
XML的设计宗旨是传输数据,而非显示数据
XML标签没有被预定义。您需要自行定义标签。
XML被设计为具有自我描述性。
XML是W3C的推荐标准
DOM4J 对xml进行操作
解析xml文件
SAXReader reader=new SAXReader();
Document doc=reader.read("book.xml");
获取根节点
Element root = doc.getRootElement();
遍历
List<Element> list=root.elements();//获取所有的子节点
for (Element ele : list) {
List<Element> child = ele.elements();
for (Element element : child) {
element.getName();//获取标签的名称
element.getText();//获取标签的内容
element.getNodeType();//获取标签的类型 1 代表元素类型 3 代表文本类型
}
}
查
Element ele=root.elementByID("1001");//根据ID快速获取指定的元素
Element pwd=ele.element("标签名");//获取指定标签名的元素
保存
OutputFormat format=OutputFormat.createPrettyPrint();//创建一个漂亮的格式
XMLWriter writer=new XMLWriter(new FileOutputStream("book.xml"),format);
writer.write(doc);//将doc对象写入的xml文件中
添加
Element root=doc.getRootElement();
Element author=root.addElement("book");//添加一个book的子元素
删除
Element root=doc.getRootElement();
Element ele=doc.elementByID("b2");
root.remove(ele);//删除指定的子节点,需要通过父节点来删除
ele.detach();//删除所有的子节点,可以自己删除自己
改
Element book=root.elementByID("b1");
Element name=book.element("name");
name.setText("西游记");
XPath
使用XPath对xml文件的元素进行导航,需要导包:jaxen.jar
Node password=doc.selectSingleNode("//user[3]/aa/password");//选出单个节点
List<Node> list=doc.selectNodes("//user");//选出多个节点
for (Node node : list) {
System.out.println(node.getName());
}
//表示//后所有的节点
*表示所有
aaa[1]表示第一个
aaa[last()]表示最后一个
bbb[@id="one"]表示属性id为one 的bbb节点
属性
查
Attribute name = ele.attribute("name");//获取单个指定的属性
List<Attribute> list = ele.attributes("name");//获取所有指定的属性
增
Element ele=root.elementByID("user");
ele.addAttribute("sex", "men");
删
Element ele=root.elementByID("user");
ele.removeAttribute("sex");
改
Attribute name = ele.attribute("name");//获取单个指定的属性
name.setText("lisi");
Schema和DTD的区别
Schema是对XML文档结构的定义和描述,其主要的作用是用来约束XML文件,并验证XML文件有效性。DTD的作用是定义XML的合法构建模块,它使用一系列的合法元素来定义文档结构。它们之间的区别有下面几点:
1、Schema本身也是XML文档,DTD定义跟XML没有什么关系,Schema在理解和实际应用有很多的好处。
2、DTD文档的结构是“平铺型”的,如果定义复杂的XML文档,很难把握各元素之间的嵌套关系;Schema文档结构性强,各元素之间的嵌套关系非常直观。
3、DTD只能指定元素含有文本,不能定义元素文本的具体类型,如字符型、整型、日期型、自定义类型等。Schema在这方面比DTD强大。
4、Schema支持元素节点顺序的描述,DTD没有提供无序情况的描述,要定义无序必需穷举排列的所有情况。Schema可以利用xs:all来表示无序的情况。
5、对命名空间的支持。DTD无法利用XML的命名空间,Schema很好满足命名空间。并且,Schema还提供了include和import两种引用命名空间的方法。
XML语法规则
所有 XML 元素都须有关闭标签
注释:您也许已经注意到 XML 声明没有关闭标签。这不是错误。声明不属于XML本身的组成部分。它不是 XML 元素,也不需要关闭标签。
XML 标签对大小写敏感
XML 必须正确地嵌套
XML 文档必须有根元素
XML 的属性值须加引号
实体引用
XML 中的注释
在 XML 中,空格会被保留
XML 以 LF 存储换行