爬虫任务二

2.1 学习beautifulsoup

学习beautifulsoup，并使用beautifulsoup提取内容。

使用beautifulsoup提取丁香园论坛的回复内容。

首先先用requests库连接到丁香园论坛的网页：

然后使用beautifulSoup找到相应user和内容的标签：

然后再试试用lxml库，xpath是用来找到相应的路径：

最后编辑于：2019.04.08 11:15:30

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

一小时入门 Python 3 网络爬虫
声明：本文讲解的实战内容，均仅用于学习交流，请勿用于任何商业用途！一、前言强烈建议：请在电脑的陪同下，阅读本文...
Bruce_Szh阅读 13,054评论 6赞 28
Ch5 Lxml库与Xpath语法
概要 Lxml库是基于libxml2的XML解析库的Python封装。该模块使用C语言编写，解析速度比Beauti...
OzanShareing阅读 1,355评论 0赞 3

2017-10-29
思亲文/梅映雪踩在松软的乡间小路秋风微凉熟...
梅映雪_阅读 162评论 0赞 0
觉知
给觉知留下空间和时间，好好觉知，充分觉知，把觉知这件事做足，做够。当呈现巨大的情绪，情感时，无论是正向的还是负向的...
黄向书阅读 191评论 0赞 1
早安52
早安52 多么期待有一次远行看见的只有爱和欢欣就如记忆中的海那么蓝脚下的沙滩依旧那么软多么期待有一次远...
小月笔记阅读 259评论 0赞 3

赞1赞

赞赏

手机看全文