登录注册写文章

使用python3 requests和bs4进行爬虫（二）爬取文章

使用python3 requests和bs4进行爬虫（二）爬取文章

为了做到更优雅，这次抛弃了urllib库的引用，使用requests和beautifulsoup搭配的方式进行

首先构建一个请求并且响应它

构建请求

然后呢到简书上找一篇文章试试手，看一下网页源码找到文章的div

找到标题

以及找到文章内容，仔细看看内容还挺不错哈哈

内容

可以发现所有的内容都在p标签里面，那么接下来就简单多了只需要

f5运行一下

最后使用codecs库来进行文件操作将文章保存到本地

没错使用上requests和bs4之后爬取文章的工作是那么的轻松呢

效果图

最后编辑于：2017.12.04 14:19:42

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

一小时入门 Python 3 网络爬虫
声明：本文讲解的实战内容，均仅用于学习交流，请勿用于任何商业用途！一、前言强烈建议：请在电脑的陪同下，阅读本文...
Bruce_Szh阅读 12,814评论 6赞 28
[实战演练]python3使用requests模块爬取页面内容
1.安装pip 我的个人桌面系统用的linuxmint，系统默认没有安装pip，考虑到后面安装requests模块...
GavinHsueh阅读 2,072评论 0赞 7
Python爬虫之Requests和Response
http header 消息通常被分为4个部分：general header即头部, request header...
徐薇薇阅读 32,105评论 0赞 5
Python网络爬虫（五）- Requests和Beautiful Soup
目录： Python网络爬虫（一）- 入门基础Python网络爬虫（二）- urllib爬虫案例Python网络爬...
一只写程序的猿阅读 13,000评论 17赞 68
Python爬虫入门（urllib+Beautifulsoup）
Python爬虫入门（urllib+Beautifulsoup）本文包括：1、爬虫简单介绍2、爬虫架构三大模块3...
廖少少阅读 9,951评论 0赞 6

10赞11赞

赞赏

手机看全文