一、基本概念
1.1、DOM
DOM是JS操作网页的接口,全称为“文档对象模型”(Document Object Model)。它的作用是将网页转为一个JS对象,从而可以用脚本进行各种操作(比如增删内容)。
文档对象模型(DOM)是网页的编程接口。它给文档(结构树)提供了一个结构化的表述并且定义了一种方式——程序可以对结构树进行访问,以改变文档的结构,样式和内容。
DOM提供了一种表述形式将文档作为一个结构化的节点组以及包含属性和方法的对象。从本质上说,它将web页面和脚本或编程语言连接起来了。
要改变页面的某个东西,JS就需要获得对网页中所有元素进行访问的入口。这个入口,连同对HTML元素进行添加、移动、改变或移除的方法和属性,都是通过DOM来获得的。
浏览器会根据DOM模型,将结构化文档(比如HTML和XML)解析成一系列的节点,再由这些节点组成一个树状结构(DOM Tree)。所有的节点和最终的树状结构,都有规范的对外接口。所以,DOM可以理解成网页的编程接口。DOM有自己的国际标准,目前的通用版本是DOM 3,下一代的DOM 4正在拟定中。
严格地说,DOM不属于JS,但是操作DOM是JS最常见的任务,而JS也是最常用于DOM操作的语言。本章介绍的就是JS对DOM标准的实现和用法。
1.2、节点
DOM的最小组成单位叫做节点(node)。文档的树形结构(DOM树),就是由各种不同类型的节点组成。每个节点可以看作是文档树的一片叶子。
节点的类型有七种。
- Document:整个文档树的顶层节点,也是访问的入口。
- DocumentType:doctype标签(比如
<!DOCTYPE html>
)。 - Element:网页的各种HTML标签(比如
<body>、<a>
等)。 - Attribute:网页元素的属性(比如
class="right"
)。 - Text:标签之间或标签包含的文本。
- Comment:注释。
- DocumentFragment:文档的片段。
这七种节点都属于浏览器原生提供的节点对象(下面要讲的Node对象)的派生对象,具有一些共同的属性和方法。
1.3、节点树
一个文档的所有节点,按照所在的层级,可以抽象成一种树状结构。这种树状结构就是DOM。
最顶层的节点就是document
节点,它代表了整个文档。文档里面最高的HTML标签,一般是<html>
,它构成树结构的根节点(root node),其他HTML标签节点都是它的下级。
除了根节点以外,其他节点对于周围的节点都存在三种关系。
- 父节点关系(parentNode):直接的那个上级节点。
- 子节点关系(childNode):直接的下级节点。
- 同级节点关系(sibling):拥有同一父节点的节点。
DOM提供操作接口,用来获取三种关系的节点。其中,子节点接口包括firstChild
(第一个子节点)和lastChild
(最后一个子节点)等属性,同级节点接口包括nextSibling
(紧邻在后的那个同级节点)和previousSibling
(紧邻在前的那个同级节点)属性。
二、与节点本身特征相关的属性
所有节点对象都是浏览器内置的Node
对象的实例,继承了Node
属性和方法。这是所有节点的共同特征。
以下属性与节点对象本身的特征相关。这些属性是实例对象(也就是节点对象)继承自Node.prototype
对象的。
2.1、Node.nodeName、Node.nodeType
nodeName
属性返回节点的名称,nodeType
属性返回节点类型的常数值。
以document
节点为例,它的nodeName
属性等于#document
,nodeType
属性等于9。
通常来说,使用nodeType
属性确定一个节点的类型,比较方便。
document.querySelector('p').nodeType === 1
// true
document.querySelector('p').nodeType === Node.ELEMENT_NODE
// true
上面两种写法等价。
2.2、Node.nodeValue
nodeValue
属性返回一个字符串,表示当前节点本身的文本值,该属性可读写。
由于只有Text节点、Comment节点、XML文档的CDATA节点有文本值,因此只有这三类节点的nodeValue
可以返回结果,其他类型的节点一律返回null
。同样的,也只有这三类节点可以设置nodeValue
属性的值。对于那些返回null
的节点,设置nodeValue
属性是无效的。
2.3、Node.textContent
textContent
属性返回当前节点和它的所有后代节点的文本内容。
// HTML代码为
// <div id="divA">This is <span>some</span> text</div>
document.getElementById('divA').textContent
// This is some text
textContent
属性自动忽略当前节点内部的HTML标签,返回所有文本内容。
该属性是可读写的,设置该属性的值,会用一个新的文本节点,替换所有原来的子节点。它有一个好处,就是自动对HTML标签转义。这很适合用于用户提供的内容。
document.getElementById('foo').textContent = '<p>GoodBye!</p>';
上面代码在插入文本时,会将<p>
标签解释为文本,而不会当作标签处理。
对于Tex
t节点和Comment
节点,该属性的值与nodeValue
属性相同。对于其他类型的节点,该属性会将每一个子节点的内容连接在一起返回,但是不包括Comment
节点。如果一个节点没有子节点,则返回空字符串。
document
节点和doctype
节点的textContent
属性为null
。如果要读取整个文档的内容,可以使用document.documentElement.textContent
。
2.4、Node.baseURI
Node.baseURI
属性返回一个字符串,表示当前网页的绝对路径。如果无法取到这个值,则返回null
。浏览器根据这个属性,计算网页上的相对路径的URL
。该属性为只读。
不同节点都可以调用这个属性(比如document.baseURI
和element.baseURI
),通常它们的值是相同的。
该属性的值一般由当前网址的URL(即window.location
属性)决定,但是可以使用HTML的<base>
标签,改变该属性的值。
三、返回当前节点相关节点的属性
以下属性返回当前节点的相关节点。
3.1、Node.ownerDocument
Node.ownerDocument
属性返回当前节点所在的顶层文档对象,即document
对象。
var d = p.ownerDocument;
d === document //true
document
对象本身的ownerDocument
属性,返回null
。
3.2、Node.nextSibling
nextSibling
属性返回紧跟在当前节点后面的第一个同级节点。如果当前节点后面没有同级节点,则返回null
。
注意,该属性还包括文本节点和注释节点。因此如果当前节点后面有空格,该属性会返回一个文本节点,内容为空格。
3.3、Node.previousSibling
previousSibling
属性返回当前节点前面的、距离最近的一个同级节点。如果当前节点前面没有同级节点,则返回null。
// html代码如下
// <a><b1 id="b1"/><b2 id="b2"/></a>
document.getElementById("b1").previousSibling // null
document.getElementById("b2").previousSibling.id // "b1"
对于当前节点前面有空格,则previousSibling
属性会返回一个内容为空格的文本节点。
3.4、Node.parentNode
parentNode
属性返回当前节点的父节点。对于一个节点来说,它的父节点只可能是三种类型:element
节点、document
节点和documentFragment
节点。
下面是如何从父节点移除指定节点。
if(node.parentNode){
node.parentNode.removeChild(node);
}
对于document
节点和documentFragment
节点,它们的父节点都是null
。另外,对于那些生成后还没插入DOM树的节点,父节点也是null
。
3.5、Node.parentElement
parentElement
属性返回当前节点的父Element
节点。如果当前节点没有父节点,或者父节点类型不是Element
节点,则返回null
。
if (node.parentElement) {
node.parentElement.style.color = "red";
}
上面代码设置指定节点的父Element
节点的CSS属性。
在IE浏览器中,只有Element
节点才有该属性,其他浏览器则是所有类型的节点都有该属性。
3.6、Node.childNodes
childNodes
属性返回一个NodeList
集合,成员包括当前节点的所有子节点。注意,除了HTML元素节点,该属性返回的还包括Text节点和Comment节点。如果当前节点不包括任何子节点,则返回一个空的NodeList
集合。由于NodeList
对象是一个动态集合,一旦子节点发生变化,立刻会反映在返回结果之中。
var ulElementChildNodes = document.querySelector('ul').childNodes;
3.7、Node.firstChild、Node.lastChild
firstChild
属性返回当前节点的第一个子节点,如果当前节点没有子节点,则返回null
。
//HTML
<p id="para-01"><span>First span</span></p>
//JS
document.getElementById('para-01').firstChild.nodeName
//"span"
注意,firstChild
返回的除了HTML元素子节点,还可能是文本节点或注释节点。
//HTML
<p id="para-01">
<span>First span</span>
</p>
//JS
document.getElementById('para-01').firstChild.nodeName
//"#text"
上面的代码中,p
元素与span
元素之间有空白字符,这导致firstChild
返回的是文本节点。
lastChild
属性返回当前节点的最后一个子节点,如果当前节点没有子节点,则返回null
。
四、节点对象的方法
4.1、Node.appendChild()
appendChild
方法接受一个节点对象作为参数,将其作为最后一个节点,插入当前节点。
var p = document.createElement('p');
document.body.appendChild(p);
如果参数节点时DOM中已经存在的节点,appendChild
方法会将其从原来的位置,移动到新位置。
4.2、Node.hasChildNodes()
hasChildNodes
方法返回一个布尔值,表示当前节点是否有子节点。
var foo = document.getElementById("foo");
if (foo.hasChildNodes()) {
foo.removeChild(foo.childNodes[0]);
}
上面代码表示,如果foo节点有子节点,就移除第一个子节点。
hasChildNodes
方法结合firstChild
属性和nextSibling
属性,可以遍历当前节点的所有后代节点。
4.3、Node.cloneNode()
cloneNode
方法用于克隆一个节点。它接受一个布尔值作为参数,表示是否同时克隆子节点,默认是false
,即不克隆子节点。
var cloneUL = document.querySelector('ul').cloneNode(true);
需要注意的是,克隆一个节点,会拷贝该节点的所有属性,但是会丧失addEventListener
方法和on-
属性(即node.onclick = fn
),添加在这个节点上的事件回调函数。
克隆一个节点之后,DOM树有可能出现两个有相同ID属性的HTML元素,这时应该修改其中一个HTML元素的ID属性。
4.4、Node.insertBefore()
insertBefore
方法用于将某个节点插入当前节点的指定位置。它接受两个参数,第一个参数是所要插入的节点,第二个参数是当前节点的一个子节点,新的节点将插在这个节点的前面。该方法返回被插入的新节点。
var text1 = document.createTextNode('1');
var li = document.createElement('li');
li.appendChild(text1);
var ul = document.querySelector('ul');
ul.insertBefore(li, ul.firstChild);
上面代码使用当前节点的firstChild
属性,在<ul>
节点的最前面插入一个新建的<li>
节点,新节点变成第一个子节点。
parentElement.insertBefore(newElement, parentElement.firstChild);
上面代码中,如果当前节点没有任何子节点,parentElement.firstChild
会返回null
,则新节点会成为当前节点的唯一子节点。
如果insertBefore
方法的第二个参数为null
,则新节点将插在当前节点的最后位置,即变成最后一个子节点。
注意,如果所要插入的节点是当前DOM现有的节点,则该节点将从原有的位置移除,插入新的位置。
由于不存在insertAfter
方法,如果要插在当前节点的某个子节点后面,可以用insertBefore
方法结合nextSibling
属性模拟。
parentDiv.insertBefore(s1, s2.nextSibling);
上面代码可以将s1
节点,插在s2
节点后面。如果s2
是当前节点的最后一个子节点,则s2.nextSibling
返回null
,这时s1
节点会插在当前节点的最后,变成当前节点的最后一个子节点,等于紧跟在s2
的后面。
4.5、Node.removeChild()
removeChild
方法接受一个子节点作为参数,用于从当前节点移除该子节点,它返回被移除的子节点。
var divA = document.getElementById('A');
divA.parentNode.removeChild(divA);
上面代码是如何移除一个指定节点。
注意,这个方法是在父节点上调用,不是在被移除的节点上调用的。
下面是如何移除当前节点的所有子节点。
var element = document.getElementById('top');
while (element.firstChild) {
element.removeChild(element.firstChild);
}
被移除的节点依然存在于内存之中,但不再是DOM的一部分。所以,一个节点移除以后,依然可以使用它,比如插入到另一个节点下面。
4.6、Node.replaceChild()
replaceChild
方法用于将一个新节点,替换当前节点的某一个子节点。它接受两个参数,第一个参数是用来替换的新节点,第二个参数是将要被替换走的子节点。它返回被替换走的那个节点。
replacedNode = parentNode.replaceChild(newChild, oldChild);
下面是一个例子。
var divA = document.getElementById('A');
var newSpan = document.createElement('span');
newSpan.textContent = 'Hello World!';
divA.parentNode.replaceChild(newSpan, divA);
上面代码是如何替换指定节点。
4.7、Node.contains()
contains
方法接受一个节点作为参数,返回一个布尔值,表示参数节点是否为当前节点的后代节点。
document.body.contains(node)
上面代码检查某个节点,是否包含在当前文档之中。
注意,如果将当前节点传入contains
方法,会返回true
。虽然从意义上说,一个节点不应该包含自身。
nodeA.contains(nodeA) // true
4.8、Node.compareDocumentPosition()
compareDocumentPosition
方法的用法,与contains
方法完全一致,返回一个7个比特位的二进制值,表示参数节点与当前节点的关系。
4.9、Node.isEqualNode()
isEqualNode
方法返回一个布尔值,用于检查两个节点是否相等。所谓相等的节点,指的是两个节点的类型相同、属性相同、子节点相同。
var targetEl = document.getElementById("targetEl");
var firstDiv = document.getElementsByTagName("div")[0];
targetEl.isEqualNode(firstDiv)
4.10、Node.normalize()
normalize
方法用于清理当前节点内部的所有Text
节点。它会去除空的文本节点,并且将毗邻的文本节点合并成一个。
var wrapper = document.createElement("div");
wrapper.appendChild(document.createTextNode("Part 1 "));
wrapper.appendChild(document.createTextNode("Part 2 "));
wrapper.childNodes.length // 2
wrapper.normalize();
wrapper.childNodes.length // 1
上面代码使用normalize
方法之前,wrapper
节点有两个Text
子节点。使用nomalize
方法之后,两个Text
子节点被合成一个。
该方法是Text.splitText
的逆方法。
五、NodeList对象,HTMLCollection对象
节点都是单个对象,有时会需要一种数据结构,能够容纳多个节点。DOM提供两种集合对象,用于实现这种节点的集合:NodeList
和HTMLCollection
。
这两个对象都是构造函数。
typeof NodeList //"function"
typeof HTMLCollection //"function"
但是,一般不把它们当作函数使用,甚至都没有直接使用它们的场合。主要是许多DOM属性和方法,返回的结果是NodeList
实例或HTMLCollection
实例,所以一般只使用它们的实例。
5.1、NodeList实例对象
NodeList
实例对象是一个类似数组的对象,它的成员是节点对象。
Node.childNodes、document.querySelectorAll()
返回的都是NodeList
实例对象。
document.childNodes instanceof NodeList // true
NodeList
实例对象可能是动态集合,也可能是静态集合。所谓动态集合就是一个活的集合,DOM树删除或新增一个相关节点,都会立刻反映在NodeList
接口之中。Node.childNodes
返回的,就是一个动态集合。
var parent = document.getElementById('parent');
parent.childNodes.length // 2
parent.appendChild(document.createElement('div'));
parent.childNodes.length // 3
上面代码中,parent.childNodes
返回的是一个NodeList
实例对象。当parent
节点新增一个子节点以后,该对象的成员个数就增加了1。
document.querySelectorAll
方法返回的是一个静态集合。DOM内部的变化,并不会实时反映在该方法的返回结果之中。
NodeList
接口实例对象提供length
属性和数字索引,因此可以像数组那样,使用数字索引取出每个节点,但是它们本身并不是数组,不能使用数组特有的方法。
//数组的继承链
myArray --> Array.prototype--> Object.prototype --> null
//NodeList的继承链
myNodeList --> NodeList.prototype --> Object.prototype --> null
5.2、HTMLCollection实例对象
HTMLCollection
实例对象与NodeList
实例对象类似,也是节点的集合,返回一个类似数组的对象。
document.links
、document.forms
、document.images
等属性,返回的都是HTMLCollection
实例对象。
HTMLCollection
与NodeList
的区别有以下几点。
(1)、HTMLCollection
实例对象的成员只能是Element
节点,NodeList
实例对象的成员可以包含其他节点。
(2)、HTMLCollection
实例对象都是动态集合,节点的变化会实时反映在集合中。NodeList
实例对象可以是静态集合。
(3)、HTMLCollection
实例对象可以用id
属性或name
属性引用节点元素,NodeList
实例对象只能使用数字索引引用。
HTMLCollection
实例的item
方法,可以根据成员的位置参数(从0开始),返回该成员。如果取不到成员或数字索引不合法,则返回null
。
var c = document.images;
var img1 = c.item(1);
//等价于下面的写法
var img1 = c[1];
HTMLCollection
实例的namedItem
方法根据成员的ID属性或name属性,返回该成员。如果没有对应的成员,则返回null。这个方法是NodeList
实例不具有的。
// HTML代码为
// <form id="myForm"></form>
var elem = document.forms.namedItem('myForm');
// 等价于下面的写法
var elem = document.forms['myForm'];
由于item
方法和namedItem
方法,都可以用方括号运算符代替,所以建议一律使用方括号运算符。
六、ParentNode接口,ChildNode接口
不同的节点除了继承Node接口以外,还会继承其他接口。ParentNode接口用于获取当前节点的Element子节点,ChildNode接口用于处理当前节点的子节点(包含但不限于Element子节点)。
6.1、ParentNode接口
ParentNode
接口用于获取Element
子节点。Element
节点、Document
节点和DocumentFragment
节点,部署了ParentNode
接口。凡是这三类节点,都具有以下四个属性,用于获取Element
子节点。
(1)、children
children
属性返回一个动态的HTMLCollection集合,由当前节点的所有Element子节点组成。
(2)、firstElementChild
firstElementChild
属性返回当前节点的第一个Element
子节点,如果不存在任何Element
子节点,则返回null
。
document.firstElementChild.nodeName
// "HTML"
上面代码中,document
节点的第一个Element
子节点是<HTML>
。
(3)、lastElementChild
lastElementChild
属性返回当前节点的最后一个Element
子节点,如果不存在任何Element
子节点,则返回null
。
document.lastElementChild.nodeName
// "HTML"
上面代码中,document
节点的最后一个Element
子节点是<HTML>
。
(4)、childElementCount
childElementCount
属性返回当前节点的所有Element
子节点的数目。
6.2、ChildNode接口
ChildNode
接口用于处理子节点(包含但不限于Element
子节点)。Element
节点、DocumentType
节点和CharacterData
接口,部署了ChildNode
接口。凡是这三类节点(接口),都可以使用下面四种方法。
(1)、remove()
remove方法用于移除当前节点。
el.remove()
上面方法在DOM中移除el
节点。注意,调用这个方法的节点,是被移除的节点本身,而不是它的父节点。
(2)、before()
before
方法用于在当前节点的前面,插入一个同级节点。如果参数是节点对象,插入DOM的就是该节点对象;如果参数是文本,插入DOM的就是参数对应的文本节点。
(3)、after()
after
方法用于在当前节点的后面,插入一个同级节点。如果参数是节点对象,插入DOM的就是该节点对象;如果参数是文本,插入DOM的就是参数对应的文本节点。
(4)、replaceWith()
replaceWith
方法使用参数指定的节点,替换当前节点。如果参数是节点对象。替换当前节点的就是该节点对象;如果参数是文本,替换当前节点的就是参数对应的文本节点。
(本系列下一节为 — Document节点)