Python 抓取花瓣图片地址

环境准备

  1. Python 2.7
  2. BeautifulSoup

BeautifulSoup 安装

教程

实现代码

import urllib2
import types
from bs4 import BeautifulSoup


def parseHtml(startPageUrl):
    req=urllib2.Request(startPageUrl)
    response=urllib2.urlopen(req)
    html=response.read()

    soup = BeautifulSoup(html)
    tags=soup.findAll('a')

    for tag in tags:
        if isinstance(tag.get('class'),list):
            if 'layer-view' in tag.get('class'):
                lastMax= tag.get('href')[6:-1]
                print "http:"+tag.find('img')['src']
    return lastMax

startPageUrl="https://huaban.com/explore/hua/?j450erym&max=0&limit=20&wfl=1"
lastMax=parseHtml(startPageUrl)
while ((not lastMax) == False):
    print lastMax
    startPageUrl='https://huaban.com/explore/hua/?j450erym&max='+lastMax+'&limit=20&wfl=1'
    lastMax=parseHtml(startPageUrl)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • # Python 资源大全中文版 我想很多程序员应该记得 GitHub 上有一个 Awesome - XXX 系列...
    aimaile阅读 26,654评论 6 427
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 174,951评论 25 709
  • 孩子,进入初中阶段,仿佛一夜之间,突然觉得你长大了。通过这一段的学校生活,尤其是军训和学校精心安排的入...
    与时阅读 4,736评论 0 1
  • 好与坏 真与假 爱与恨 我是个大龄单身女生,以前在一家洗浴做前台收银员。 20...
    小鈈阅读 3,126评论 0 1