简介:
使用了python中的requests和re模块爬去网页中的图像进行保存
操作流程:
先是使用了requests模块将用来获取一个网页的内容,即获取网页html文件,网页中的图片都是由一个href的属性链接指向,通过re正则表达式模块获取所有的图片的链接地址,再通过requests请求图片文件,进行保存,然后就可以查看下载的图片了。
具体代码:
import requests
import re
#打开网页
r = requests.get("https://www.meijutt.com/topiclist/2018xinjutop.html")
html = r.text #获取网页html文档的字符内容,有些网页可能乱码
reg = r'src="(http.+?\.jpg)"' # 匹配图片链接的正则表达式
reg = re.compile(reg) #
imageslink = reg.findall(html) #在html文档中查找所有的图片链接
for img in imageslink:
print(img)
imgs = requests.get(img)
name = img[-9:] #重新设置图片文件名
with open(name, 'wb') as f:
f.write(imgs.content) #将图片写入文件