使用requests爬虫获取网页图像

简介：

使用了python中的requests和re模块爬去网页中的图像进行保存

操作流程:

先是使用了requests模块将用来获取一个网页的内容，即获取网页html文件,网页中的图片都是由一个href的属性链接指向，通过re正则表达式模块获取所有的图片的链接地址，再通过requests请求图片文件，进行保存，然后就可以查看下载的图片了。

具体代码：

import requests
import re

#打开网页
r = requests.get("https://www.meijutt.com/topiclist/2018xinjutop.html")
html = r.text #获取网页html文档的字符内容，有些网页可能乱码
reg = r'src="(http.+?\.jpg)"'  # 匹配图片链接的正则表达式
reg = re.compile(reg)  #
imageslink = reg.findall(html)   #在html文档中查找所有的图片链接

for img in imageslink:
    print(img)
    imgs = requests.get(img)
    name = img[-9:]  #重新设置图片文件名
    with open(name, 'wb') as f:
        f.write(imgs.content)  #将图片写入文件

最后编辑于：2018.12.07 12:46:29

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

使用requests爬虫获取网页图像

简介：

操作流程:

具体代码：

友情链接更多精彩内容