网页图片爬虫

import urllib

import urllib.request

import re #正则表达式

def load_page(url):

request=urllib.request.Request(url)#发送网络请求

response=urllib.request.urlopen(request)#根据url打开页面

data=response.read()#获取页面响应数据

return data#返回响应数据

def get_image(html):

regx=r'http://[\S]*jpg'#存储正则表达式

pattern=re.compile(regx)#编译表达式构造匹配模式

get_image=re.findall(pattern,repr(html))#进行正则匹配并返回结果

num=1

#遍历获取的图片

for img in get_image:

image=load_page(img)

#将图片存入到指定文件夹

with open('D:\\photo\\%s.jpg' %num,'wb')as fb:

fb.write(image)

print('正在现在第%s张图片' %num)

num=num+1

print("下载完成")

url='http://p.weather.com.cn/2018/01/2832905.shtml#p=1'

html=load_page(url)

get_image(html)

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

赞1赞

赞赏

手机看全文