爬虫实战01:用Excel爬取全国空气质量数据

作者:猿教授

提起爬取数据,我们一般想到的是编程,其实不然,有些时候Excel就可以,不过Excel对网站的数据有要求,对,必须是Table结构!

本次实战课题:用Excel爬取全国空气质量数据

1. 找到数据入口

图1,在Excel中依次选择菜单「数据」「获取外部数据」「自网站」,弹出「新建Web查询」页面。

图1 数据自网站

图2,新建Web查询页面相当于一个Excel内嵌的浏览器。

图2 Excel内嵌浏览器


2. 加载目标页面

拷贝站点地址http://www.86pm25.com/paiming.htm内嵌浏览器「地址栏」,点击「转到」,等待页面加载。

注意地址栏下方的提示:单击(C)→,然后单击“导入”(C)

图3,加载完成后,页面上每个表的左上角都有一个黄色箭头,鼠标悬停在箭头上方,提示单击可选定此表

图3 载入目标页


3. 导入目标数据

图4,找到《全国空气质量实时排名》表,点击表左上角黄色箭头选中。

选中后黄色箭头→变成蓝色对钩 ✔,整个表格呈现浅蓝色背景填充,此时点击「导入」,可能有弹窗提示,也可能没有,确定后数据已经在Excel表格中了。

图4 选中目标数据表

看吧,用Excel爬取数据是不如编程有乐趣,但是绝对够直接了当、高效实用。


4. 作业

跟完实战,自己练习爬取以下数据:

  • 全球500强企业排行榜
  • 中国大学排行榜
  • 列车时刻表

恭喜你!获得一项元技能!!!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容