登录注册写文章

百度贴吧图片爬虫

百度贴吧图片爬虫

闲来无事，逛了一下超市买了一点东西，我们今天来做一个百度壁纸贴吧的爬虫吧

屏幕快照 2017-08-11 10.51.00.png

#coding=utf-8
import urllib
import re

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def getImg(html):
    reg = r'src="(.+?\.jpg)" pic_ext'
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    x = 0
    for imgurl in imglist:
        urllib.urlretrieve(imgurl,'%s.jpg' % x)
        x+=1


html = getHtml("http://tieba.baidu.com/p/2460150866")

print getImg(html)

代码都在这里了点击运行图片就下下来了

屏幕快照 2017-08-11 10.53.22.png

屏幕快照 2017-08-11 10.47.10.png

顺便送个福利
pyCharm mac 的破解
server选项里边输入 http://idea.imsxm.com/

最后编辑于：2017.12.10 00:48:47

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

Python笔记-百度贴吧图片爬虫
概述近来花了一些时间简单学习了一下python，简而言之：抛弃运行效率因素不说，从编码的角度，其优雅、简洁的语法...
nmnethaha阅读 980评论 6赞 4
一小时入门 Python 3 网络爬虫
声明：本文讲解的实战内容，均仅用于学习交流，请勿用于任何商业用途！一、前言强烈建议：请在电脑的陪同下，阅读本文...
Bruce_Szh阅读 13,058评论 6赞 28

新手向爬虫（三）别人的爬虫在干啥
爬虫文章 in 简书程序员专题： like:128 - Python 爬取落网音乐 like:127 - 【图文详...
treelake阅读 29,775评论 33赞 638
解释性语言与编译性语言
编译型语言在程序执行之前，有一个单独的编译过程，将程序翻译成机器语言，以后执行这个程序的时候，就不用再进行翻译了。...
一个有味道的名字阅读 372评论 0赞 0

友情链接更多精彩内容

赞1赞

1赞赏

手机看全文