为了让搜索变得有趣,谷歌提供了Google doogle, 微软提供了Bing壁纸, 百度直接抄了Google doogle(百度NB!), 作为一名摄影爱好者, 凭心而论, Bing每日壁纸的质量还是很高的, 值得收藏, 于是我写了一个获取Bing历史壁纸的爬虫(爬虫下载链接在文末)
写爬虫也需要好工具, 这里推荐XPath Helper!
安装XPath Helper
打开需要爬取的网站
打开XPath Helper, 输入/html/body/div[@class="page"]/span
, 获取页数信息
获取图片日期信息
/html/body/div[@class="container"]/div/div[@class="card progressive"]/div[@class="description"]/p[@class="calendar"]/em
获取图片下载链接信息
/html/body/div[@class="container"]/div/div/a/@href
编写爬虫脚本,并运行
如果你不是程序员, 也可以使用编译好的bing.exe, 右键管理员身份运行即可~
爬虫脚本和.exe文件都被我放到了github上, 感兴趣可以自行下载, 链接地址 https://github.com/zhaoolee/ChromeAppHeroes/tree/master/%E7%9B%B8%E5%85%B3%E8%B5%84%E6%BA%90/bing
插件下载地址
https://chrome.google.com/webstore/detail/xpath-helper/hgimnogjllphhhkhlmebbmlgjoejdpjl
本文属于Chrome插件英雄榜文集的一部分, 为了集合更多的程序员和工具爱好者, 将Chrome插件英雄榜维护下去, 我已将Chrome插件英雄榜 文集的所有内容托管到Github, 项目地址https://github.com/zhaoolee/ChromeAppHeroes , 欢迎广大程序员和工具爱好者们为项目贡献力量, 也欢迎拥有Github账户的朋友们为本项目加星, 非常感谢!