python自动爬取面包旅行页面的高清图片

#!/usr/bin/env python
# -*- coding: utf-8 -*- 

'''
Created on Oct 29, 2016

@author: xwang

'''

import urllib2
import urllib
import re

urls = ["http://web.breadtrip.com/trips/2388032662/", ...]
rex = '"http://photos.breadtrip.com/.*imageView/2/w/960/q/85" target="_blank"'

def pachong():
    y = 0
    for url in urls:
        up = urllib2.urlopen(url)
        cont = up.read()

        imgre = re.compile(rex)
        imglist = re.findall(imgre,cont)

        x = 0
        y = y + 1
        z = url[-7:-1]
        for imgurl in imglist:
            print imgurl[1:-17],x
            urllib.urlretrieve(imgurl[1:-17],'C://Users//Administrator//Desktop//123//s_%s%s%s.jpg' % (x,y,z))
            x = x + 1


if __name__=='__main__':
    pachong()

最后编辑于：2017.12.04 06:54:06

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Python爬虫入门-爬取pexels高清图片
先上张图片：小姐姐.png 首先打开网址：https://www.pexels.com/,然后下来会发现下面的图...
小小佐阅读 7,978评论 1赞 0
python自动爬取别致数据并保存图片
SameX_4869阅读 2,338评论 0赞 0

python lxml爬取页面的编码问题
背景最近开始结合python爬虫+flask+react做一个全栈项目，基本方案是flask提供api接口，以j...
CMASTER阅读 4,434评论 0赞 1
python爬取链家租房之获取房屋的链接和页面的详细信息
因为期末考试的缘故，本打算一个星期结束的爬虫，拖了很久，不过，也有好处：之前写的时候总是被反爬，这几天复习之余写了...
宁静消失何如阅读 4,531评论 0赞 1
Deepin系统的初步使用
deepin 系统是我见过的最华丽的linux系统，而且安装的常用的办公（wps），沟通（qq）等软件，自带的de...
疯狂的冰块阅读 12,061评论 1赞 0

赞1赞

赞赏

手机看全文