登录注册写文章

python通过re、xpath、beautiful soup三种方法进行网页解析

python通过re、xpath、beautiful soup三种方法进行网页解析

python解析网页有很多种方法，下面介绍三种方法：

1、正则表达式：re

2、xpath

3、beautiful soup

首先先获取网页源代码，可以通过requests方式获取

requests获取网页源代码

接下来对网页源代码部分截图进行解析，我们目标是提取小说所有章节网址，如下图所示：

网页截图

1、通过正则表达式：re 提取每章网址

re方式解析

re方式提取结果显示

2、通过xpath方式：提取每章网址

xpath方法解析

xpath方法解析提取数据结果

3、通过beautiful soup方式：提取每章网址

beautiful soup方法解析

soup解析提取数据结果显示

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

一、python爬虫基础与html文档解析
爬虫是什么爬虫是一段用来抓取互联网数据的一段程序，给定一个位置（url）为起点，爬虫从这个url开始，爬去互联网上...
zhile_doing阅读 764评论 0赞 0
Python爬虫之Beautiful Soup用法
关于bs4，官方文档的介绍已经非常详细了,传送：Beautifulsoup 4官方文档,这里我把它组织成自己已经消...
徐薇薇阅读 6,024评论 0赞 1

HTML解析大法-Beautiful soup
Beautiful soup是一个可以从HTML或XML文件中提取数据的python库。在python爬虫开发中，...
朱双伟_西潮坝上阅读 1,320评论 0赞 1
一笔一画绘生活 Day147 成为最好的自己
清醒时做事，糊涂时读书，大怒时睡觉，独处时思考；做一个幸福的人，读书，旅行，努力工作，关心身...
哈鲁小米阅读 655评论 3赞 4
我，带着爱情去旅行了
如果每一段感情都像贺岁电影，那爱情也就不会刻骨铭心了吧。曾经那些普通而平凡的风景，也会只是因为多了一个人，而显得惊...
605室草_暴雨阅读 251评论 0赞 0

友情链接更多精彩内容

2赞3赞

赞赏

手机看全文