xpath使用路径表达式在xml和html中进行导航
xpath节点关系:
父节点、子节点、同胞节点、先辈节点、后代节点
Xpath语法:
表达式 | 说明
article | 选取所有aricle元素所有子节点
/article | 选取根元素article
article / a | 选取所有属于article子元素的a元素
// div | 选取所有属于子元素的div元素(无论出现在文档任何地方)
article // div | 选取所有属于article元素后代的div元素,不管它出现在article之下的任何位置
//@class | 选取所有名为class的属性
/article/div[1] | 选取属于article子元素的第一个div
/article/div[last()] | 选取属于article子元素的最后一个 div元素
/article/div[last()-1] | 选取属于article子元素的倒数第二个div元素
//div[@lang] | 选取所有拥有lang属性的div元素
//div[@lang = 'eng'] | 选取所有lang属性为eng的div元素
/div/* | 选取div元素的所有子节点
//* | 选取所有元素
//div[@*] | 选取所有带属性的div元素
//div/a/ | //div/p | 选取所有div元素的a和p元素
//span | //ul | 选取所有的span和ul元素
article/div/p | //ul | 选取所有属于article元素子元素div的子元素p以及所有的span元素
//span[contains(@class,'vote-post-up')] | 选取所有的class中含有vote-post-up的span子元素