爬虫入门：爬取百度贴吧图片

#coding = utf-8

importre

importurllib

def getHtml(url):

page = urllib.urlopen(url)

html = page.read()

return html

def getImg(html):

reg =r'src="(.+?\.jpg)" pic_ext'

#reg = r'src="(.+?\.jpg)" alt'

imgre = re.compile(reg)

imglist = re.findall(imgre,html)

x=1

for imgurl in imglist:

urllib.urlretrieve(imgurl,'C:\\img\\%s.jpg'% x)

x+=1

return x

html = getHtml("https://tieba.baidu.com/p/2460150866")

print getImg(html)

执行结果一共69张图片：

最后编辑于：2017.12.09 03:03:44

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

python3.5爬虫实例（一）简单图片抓取
为了提高教学的趣味性，先不从基本的正则表达式入手介绍，用到的时候会解释一下。先直接一个图片抓取的实例（能快速保存...
下水道潜水员阅读 1,103评论 0赞 1
Python 实现简单的爬虫功能 -----批量下载网页中的图片
我使用的是macPro , mac 自带了python2.7 , 我自己下载了pytho3.6根据操作进行安装后,...
十二月的水瓶座阅读 1,940评论 0赞 0

Python爬虫之下载网页图片
传统的方式是在想要的图片上鼠标点击右键另存为，或者用截图的方式保存图片，其实我们还可以通过使用简单的Python语...
keitwo阅读 2,611评论 0赞 0
投妻所好
“投妻所好”四个字是老郭对我家先生近期沉迷花草的评价。说来话不长，也不短，我和先生互撩是在网上，实际相距千余公里...
伊石榴阅读 386评论 0赞 0
马粪争夺案背后的经济效率
今天是1000天写作的第十三天。今天的话题比较有趣：马粪争夺案。这是北京大学经济学教授薛兆丰讲的一个故事，叫做马...
丁晓磊阅读 3,165评论 0赞 1

友情链接更多精彩内容

2赞3赞

赞赏

手机看全文