下载美丽的沙滩(1_4)

一、总结:需要老师了,
0,我通过简书提交作业,如何看您的点评,我给您发微博了
1,代理这个地方,需要老师指导,window 和ubuntu 下,蓝灯的安装和使用。
2,urllib.request.urlretrieve(url, path + url.split('/')[-2] + url.split('/')[-1]) #这个地方如何改写为支持代理,需要老师指点
如何能支持代理,特别是蓝灯代理,以及蓝灯应该如何设置。我现在是firefox 能上国外网站的。
3,wb_data = requests.get(full_url,proxies=proxies) 使用代理马上soup 中什么也没有了,我用的代理是蓝灯,window环境,需要老师指点。

二、成果展示

week1-4-2.jpg
week1-4.jpg

三代码

#!C:\Python35\python.exe
# coding=utf-8
import requests
from bs4 import BeautifulSoup
import urllib.request
# 此网站会有针对 ip 的反爬取,可以采用代理的方式
proxies = {"http":"127.0.0.1:61070"}
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/54.0.2840.99 Safari/537.36'
}


# 'http://weheartit.com/inspirations/beach?page=8' full url

base_url = 'http://weheartit.com/search/entries?utf8=%E2%9C%93&ac=0&query=beach&page='
#http://weheartit.com/search/entries?utf8=%E2%9C%93&ac=0&query=beach&page=
path = './aaa/'  # the last / can not lost

def get_image_url(num):
    img_urls = []
    for page_num in range(1,num+1):
        full_url = base_url + str(page_num)
        #wb_data  = requests.get(full_url,proxies=proxies)  使用代理马上soup 中什么也没有了,我用的代理是蓝灯,window环境,需要老师指点
        wb_data = requests.get(full_url)
        soup = BeautifulSoup(wb_data.text,'lxml')
        print(soup)
        #imgs = soup.select('img.entry_thumbnail')
        #entry-thumbnail
        imgs = soup.select('#content > div.grid-thumb.grid-responsive > div > div > div > a > img')
        #content > div.grid-thumb.grid-responsive > div > div > div > a > img
        print("55555")
        for i in imgs :
            img_urls.append(i.get('src'))

    print((len(img_urls)),'images shall be downloaded!')
    return img_urls

# get_image_url(1)

# 'http://data.whicdn.com/images/268835689/superthumb.jpg'
def dl_image(url):
    urllib.request.urlretrieve(url, path + url.split('/')[-2] + url.split('/')[-1])  #这个地方如何改写为支持代理,需要老师指点
    print('Done')

#
for url in get_image_url(3):
    dl_image(url)



最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、JS前言 (1)认识JS 也许你已经了解HTML标记(也称为结构),知道了CSS样式(也称为表示),会使用HT...
    凛0_0阅读 7,756评论 0 8
  • python模块(包)之urllib urllib:官方文档是最好的模块表达说明。 urllib is a pac...
    道无虚阅读 5,509评论 0 1
  • 第一篇 与人相处的基本技巧 一.如欲采蜜,勿蹴蜂房 1.只有不够聪明的人才批评、指责和抱怨别人。我们想指责或纠正...
    小雏菊lay阅读 15,815评论 0 7
  • TED信息 Marco Tempest: A magical tale (with augmented reali...
    林中有男阅读 1,697评论 0 1
  • 每日私信抽取高质量问题答疑,为您的英语学习助力。微博TeacherGwen发送私信即可。
    TeacherGwen阅读 1,414评论 0 0

友情链接更多精彩内容