#!/usr/bin/env python
# -*- coding: utf-8 -*-
'''
Created on Oct 29, 2016
@author: xwang
'''
import urllib2
import urllib
import re
urls = ["http://web.breadtrip.com/trips/2388032662/", ...]
rex = '"http://photos.breadtrip.com/.*imageView/2/w/960/q/85" target="_blank"'
def pachong():
y = 0
for url in urls:
up = urllib2.urlopen(url)
cont = up.read()
imgre = re.compile(rex)
imglist = re.findall(imgre,cont)
x = 0
y = y + 1
z = url[-7:-1]
for imgurl in imglist:
print imgurl[1:-17],x
urllib.urlretrieve(imgurl[1:-17],'C://Users//Administrator//Desktop//123//s_%s%s%s.jpg' % (x,y,z))
x = x + 1
if __name__=='__main__':
pachong()
python自动爬取面包旅行页面的高清图片
最后编辑于 :
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- 先上张图片: 小姐姐.png 首先打开网址:https://www.pexels.com/,然后下来会发现下面的图...
- 背景 最近开始结合python爬虫+flask+react做一个全栈项目,基本方案是flask提供api接口,以j...
- 因为期末考试的缘故,本打算一个星期结束的爬虫,拖了很久,不过,也有好处:之前写的时候总是被反爬,这几天复习之余写了...