登录注册写文章

python 爬虫学习第二弹

堕落白天使

python 爬虫学习第二弹

连续好几天不更新了,以后坚持每周更新两篇,要养成一个自律的好习惯,才有可能摆脱一个菜鸟

本章实现的是一个简单的爬虫,爬取贴吧图片

首先还是简单介绍一下本章使用的三个库

1.urllib 上一弹简单介绍过是用来进行url请求的库

2.re 库是用来从html 库中解析获取图片的

3.os库是系统库,获取系统的某些信息

主要分为一下几个步骤

1.根据url获取网页html内容

2.从html中解析出所有的jpg 或者png图片的url

3.用图片url下载图片并保存成指定的文件名

第一步根据url获取网页html内容

第二步从html中解析出所有jpg或者png图片的url

备注:在解析图片url的时候使用到了正则表达式 (非常重要的东西) 以后网络爬取的时候会经常用到

第三步用图片url下载图片并保存成指定文件名

以下是完整的代码

代码很简单,多多练习熟能生巧,每天学习一点新东西,早日摆脱菜鸟,做一名合格的程序猿,加油~~~

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

django by example 实践 bookmarks 项目(二）
点我查看本文集的说明及目录。本项目相关内容（ github传送）包括：实现过程： CH4 创建社交网站 CH...
学以致用123阅读 1,539评论 1赞 2
源码众享最新教程 - 草稿
¥开启¥ 【iAPP实现进入界面执行逐一显】〖2017-08-25 15:22:14〗《//首先开一个线程，因...
小菜c阅读 7,435评论 0赞 17

一小时入门 Python 3 网络爬虫
声明：本文讲解的实战内容，均仅用于学习交流，请勿用于任何商业用途！一、前言强烈建议：请在电脑的陪同下，阅读本文...
Bruce_Szh阅读 13,056评论 6赞 28
《Python 网络数据采集》第一部分笔记
第一部分创建爬虫重点介绍网络数据采集的基本原理 : 如何用 Python 从网络服务器请求信息，如何对服务器...
万事皆成阅读 2,338评论 0赞 5
成长，需要一些事儿来拉动
成长，不止是岁月的积累，更是关系的变化。这种变化的过程中，有很多待解决的问题，只有尝试着去解决。日子还要继续，但是...
奇妙的奇阅读 192评论 0赞 0

友情链接更多精彩内容

赞1赞

手机看全文