1.4 插件元素详解 --webscraper操作手册

上一节我们拆解了抓取数据的基本步骤,
这一小节我们来认识一下webscraper这个插件的各个选项和按钮
首先要知道我们创建的一个抓取数据的工程就是一个sitemap对象

主页面
主页面
  • 1 Sitemaps: 该页面记录了我们创建的所有的sitemap工程目录
  • 2 sitemap: 在Sitemaps中点击单个sitemap工程我们就可以编辑每个sitemap工程,具体有以下几个选项:
    Selectors: 当前sitemap的数据选择区域
    Selectors graph:当前sitemap选择器的图结构
    Edit metadata:编辑当前sitemap的源数据(主要包括sitemap名称和爬取的url)
    Scrape:启动sitemap工程进行抓取数据
    Browse: --
    Export Sitemap: 当我们编写好了sitemap之后可导出当前工程的配置文件
    Export data as CSV: 当sitemap工程抓取完之后,通过此选项导出CSV(excel文件)
    2
  • 3 Create new sitemap: 新建sitemap工程,既可以直接新建工程也可以直接使用别人的sitemap配置。
    Create Sitemap:创建新的sitemap
    Sitemap name:你的新sitemap的名称
    Start url: 要抓取的网站的链接,直接从浏览器复制粘贴进去
    import Sitemap:导入其他的sitemap配置文件
    Create new sitemap

主页面基本上就这些元素,在后面的教程示例中我们会用到这些内容,用几次就熟悉了。
接下来我们用几个例子来带你熟悉这个插件的神奇之处

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

友情链接更多精彩内容