Python彼岸网图片爬取源码

前言

无聊写着玩玩

运行结果


import  requests
from lxml import etree
import  os

if not os.path.exists("./壁纸"):
    os.makedirs("壁纸")
url="http://pic.netbian.com/4kfengjing/index_%d.html"
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36'}
for page in range(1,172):
    urls = format(url%page)
    response=requests.get(url=urls,headers=headers).text
    tree=etree.HTML(response)
    li_list=tree.xpath("//div[@class= 'slist']/ul/li")
    for li in li_list:
     new_url="http://pic.netbian.com"+li.xpath("./a/img/@src")[0]
     img_data=requests.get(url=new_url,headers=headers).content
     img_name=li.xpath("./a/img/@alt")[0]+".jpg"
     img_name=img_name.encode("iso-8859-1").decode('gbk')
     print(img_name)
     img_path="./壁纸/"+img_name
     with open(img_path,"wb")as fp:
        fp.write(img_data)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容