穿汉服的女孩是真的好看,一不小心进入某网址,彻底改变了我的人生价值观,还爬什么其他妹子,就一个字,爬她,爬它,就爬她!
梅开二度,作为爬图小能手的我又来啦,这次带给大家的是精美的汉服,我真的是太喜欢这种传统服饰了,为了收藏一波,所以就爬了某站,你们觉得也喜欢的话,也可以收藏一波!
汉服爬取
这次的网站比较简单,所以爬虫代码也简单了不少。零基础的我觉得也能看懂,实在不行,我放入全部代码,嘿嘿,保证我有的妹子,你们也要有!
抓取汉服:
第一步:分析网站
第二步:获得子网站链接
第三步:获得标题和图表网址
第四步:打包下载图片
第五步:编写主函数
第六步:欣赏图集
第七布:打开淘宝
第一步:分析网站
网址如下:http://www.aihanfu.com/zixun/tushang-1/
这是第一页的网址,根据观察,第二页网址也就是序标1变成了序标2,依次类推,就可以访问全部页数。
第二步:获得子网站链接:
图就是我上面的那张图,这里可以用soup或者re或者xpath都行的,我比较喜欢用xpath来定位,编写定位函数,获得每个子网站链接,然后返回主函数,这里使用了一个技巧,在for循环中,你们可以看看!
第三步:获得标题和图表网址:
我们点开一个网址链接,如图所示:
可以发现标题在head的节点里面,那这个时候有人肯定会问,要标题干嘛,
这个创建文件夹的时候需要,不然用0,1,2,3表示多俗气。
图表下载网址在我所指的箭头方向,那些节点打开都是相同的规律。
这里我就不累赘表示了。
第四步:打包下载图片:
因为从链接我发现这个网址的图片质量还过得去,如果你们追求高清图片,要4k图,那你们可以点击这篇博客 真4k抓取 里面有讲到怎么抓4k的方法,所有网站都是适用的。
第五步:编写主函数:
个人感觉这个网站真的很简单,基本没怎么出bug,一次性的写完了。
第六步: 欣赏图集:
我抓图绝大部分就是用来作壁纸的,或者满足我自己的需求,其他方向我也不知道能干什么,对于爬虫来说,抓图片或许是最简单的一个片面,但也是最幸福的方向!
第七步: 打开淘宝:
抓完了,发现一件特别好看的汉服,打开淘宝一看999,告辞,等等,我没有女朋友啊,我买这个干嘛,但凡有一粒花生米,我也不会来抓汉服送女友了。
求关注,求点赞,求三连,你的支持是我最大的动力哈!亦可加我的QQ爬虫交流群群:657485271,大家一起学习交流、