XPath用于 XML 文档中对元素和属性进行遍历。小编主要用于在爬虫代码中进行节点选择,下面主要给大家总结一下最常用的一些用法。
常用路径表达式
image.png
举例
div div节点的所有子节点
/div 从根目录开始定位,这里是根目录下第一级的div标签
//div 精准定位到div,忽略前面的所有节点
. 选取当前节点
.. 选取当前节点的父节点
div[@class="container"]
函数
- not 不包含
tbody下不包含class属性的tr节点
//tbody/tr[not(@class)]
- text() 文本,包含特定文字,精准匹配
包含“任务类型”的li标签
//li[text()='任务类型:']
- contains 使用contains函数可指定仅包含部分的信息
包含有文字“任务类”的及节点
//li[contains(text(),'任务类')]
后续还有诸如starte-with等等,但我用的也不多,这些就是比较普遍的一些操作了,如果想了解更多,可以去参考一下教程