20200713-Web Scraper网页爬虫工具

Web Scraper网页爬虫工具

by / luo

时间：2020年7月13日

一、需要的软件

谷歌浏览器

插件 Web Scraper（点击下载：http://suo.im/6cCLUS）

二、步骤

以知乎热榜为例

进入知乎热榜

打开「开发者工具」

点击上下布局

点击「Create Sitemap」

name 设置为「zhihu/hot」，URL为当前页面的地址：https://www.zhihu.com/hot

点击「Add new selector」

依次点击如图位置

点击预览数据

点击「Sitemap zhihu/hot」 - 「Scrape」开始爬虫

保持默认设置，点击「Start scraping」

点击refresh 刷新数据

出现下图表示获取成功

获取成功

点击「Sitemap zhihu/hot」 - 「Export data as CSV」

「Sitemap zhihu/hot」 - 「Export data as CSV」

点击 Download now 下载

文件下载成功，在下载目录可查看

在下载目录可查看

点击文件即可查看，爬虫完毕

爬虫完毕

注：需要获取多页时，在URL中设置需要爬取的页面即可

三、参考文章

最后编辑于：2020.07.14 20:11:24

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。