网页图片爬虫

import urllib

import urllib.request

import  re #正则表达式

def load_page(url):

    request=urllib.request.Request(url)#发送网络请求

    response=urllib.request.urlopen(request)#根据url打开页面

    data=response.read()#获取页面响应数据

    return  data#返回响应数据

def get_image(html):

    regx=r'http://[\S]*jpg'#存储正则表达式

    pattern=re.compile(regx)#编译表达式构造匹配模式

    get_image=re.findall(pattern,repr(html))#进行正则匹配并返回结果

    num=1

    #遍历获取的图片

    for img in get_image:

        image=load_page(img)

        #将图片存入到指定文件夹

        with open('D:\\photo\\%s.jpg' %num,'wb')as fb:

            fb.write(image)

            print('正在现在第%s张图片' %num)

            num=num+1

    print("下载完成")

url='http://p.weather.com.cn/2018/01/2832905.shtml#p=1'

html=load_page(url)

get_image(html)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,286评论 19 139
  • 本内容为《用Python写网络爬虫》书籍内容,有兴趣的读者可以购买本书,本章的代码皆可在Python3中运行。为了...
    海人为记阅读 2,300评论 0 5
  • Python爬虫入门(urllib+Beautifulsoup) 本文包括:1、爬虫简单介绍2、爬虫架构三大模块3...
    廖少少阅读 10,002评论 0 6
  • 正值冬天,好多日受到雾霾侵袭,甚是忧郁,幸好一场冬雨,使阳光再现,也给我们触摸冬天的机会。 于是到公园走走,停停,...
    小苜蓿阅读 536评论 4 11
  • 一个小时了 还是睡不着 心中慌乱 烦躁o(*≧д≦)o!!起来看书 看不进 放着钢琴曲也无法入眠 自己生自己的气 ...
    夢尛潔阅读 208评论 0 0