学习XPath的基本知识

推荐 Xpath教程很容易理解。
推荐可以将常用的语法记下来，不常用的可以等用的时候再查。

常用语法

举例，比如在双面胶-淘宝搜索页面

输入: //[@class="m-itemlist"]//a[@trace-price<20]/@href*，用来提取出class为itemlist里边a标签里边所有price 小于20的产品，并将其href(即超链接)输出

结果展示

需要结合Chrome浏览器的F12一起使用，先选定大致的框架，比如itemlist这个class，然后逐渐加上更多的要求，具体见文首给出的链接学习。

知道这些就可以抓取1024上的图片和磁力链接了，目测是不是很简单

作为一名1024资深游客，首先在技术讨论区选择一篇好文，这里用的是[榴民资讯]11月精品主题推荐（49期）

还是熟悉的味道

有两个主要标签 header 和 main 鼠标移动到main上，可以看到内容页面都被包含起来，所以第一个节点应该选main。

main标签

我们看到图片前边都有一个属性src，这个src后边就是我们所需的图片链接。

综上，使用XPath表达式: //[@id="main"]//@src*

mark

输入XPath代码，获得图片链接。

mark

同理，我们可以发现，磁力链接前边都有一个blockquote，与上一条处理方式类似，使用XPath表达式: //[@id="main"]//blockquote*

磁力链接

以上

最后编辑于：2018.06.22 12:03:46

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。