节点选择语法
/ 从根节点选取,获取标签下的文本用text(),例如:a/text() 获取a下的文本 a//text() 获取a下的所有标签的文本 //a[text()='下一页'] 通过文本进行定位
// 从匹配选择的当前节点选择文档中的节点,而不考虑他们的位置
. 选择当前的节点
.. 选择当前节点的父节点
@ 选取属性 例如:1.a/@href 2.//ul[@id='detail-list'] 定位属性
查找某些特定的节点或者包含某个指定的之的节点
//div/a[n] 选择div下的第n个a标签
//div/a[last()] 选择div下的最后一个a标签
//div/a[lase()-1] 选择div下的倒数第二个a标签
//div/a[position()<3] 选择div下的最前面两个a标签
选择未知节点
* 匹配任何元素节点
@* 匹配任何属性节点
node() 匹配任何类型的节点
选取若个路径
| 或,和 例如://div/a | //div/span 选取div下的所有a和所有span标签
在python中使用xpath
1.先下载lxml模块,pip install lxml
2.导入lxml模块中的etree库,from lxml import etree
3.利用etree.HTML,将字符串转化为Element对象
4.Element对象具有xpath的方法
html = etree.HTML(response)
5.查看element对象中包含的字符串
etree.tostring(html).decode()