Python彼岸网图片爬取源码

前言

无聊写着玩玩

运行结果

import  requests
from lxml import etree
import  os

if not os.path.exists("./壁纸"):
    os.makedirs("壁纸")
url="http://pic.netbian.com/4kfengjing/index_%d.html"
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36'}
for page in range(1,172):
    urls = format(url%page)
    response=requests.get(url=urls,headers=headers).text
    tree=etree.HTML(response)
    li_list=tree.xpath("//div[@class= 'slist']/ul/li")
    for li in li_list:
     new_url="http://pic.netbian.com"+li.xpath("./a/img/@src")[0]
     img_data=requests.get(url=new_url,headers=headers).content
     img_name=li.xpath("./a/img/@alt")[0]+".jpg"
     img_name=img_name.encode("iso-8859-1").decode('gbk')
     print(img_name)
     img_path="./壁纸/"+img_name
     with open(img_path,"wb")as fp:
        fp.write(img_data)

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Python06-爬取番号网站图片（未完成），编码乱码，防爬办法。
1-19日更新。今天打开电脑，又跑了一遍代码。发现，整个87页都能下载下来了，估计是ip解封了，说明我编写的代码，...
heiqimingren阅读 10,553评论 0赞 2
Python项目实战:爬取斗图网表情包图片
前言相信大家在和别人聊天的时候都很喜欢斗图吧,斗着斗着斗忘记睡觉了,哈哈,感情得到了升华,下面来介绍一个利用Py...
慌翯阅读 3,446评论 0赞 1

程序员想买车，用python获取了网上各种车的图片，附带教程和源码
现在对车感兴趣或者想买车的人越来越多了，有这样一位程序员，也是从小对汽车感兴趣，这回，他用很简单的python入门...
TONOW阅读 1,618评论 0赞 0
送你一个晚安故事
我是黑夜里大雨纷飞的人啊 1 “又到一年六月，有人笑有人哭，有人欢乐有人忧愁，有人惊喜有人失落，有的觉得收获满满有...
陌忘宇阅读 12,732评论 28赞 53
信任重要性
信任包括信任自己和信任他人很多时候，很多事情，失败、遗憾、错过，源于不自信，不信任他人觉得自己做不成，别人做不...
吴氵晃阅读 11,351评论 4赞 8

1赞2赞

赞赏

手机看全文