登录注册写文章

BeautifulSoup解析页面造成信息丢失的解决办法

BeautifulSoup解析页面造成信息丢失的解决办法

在爬取前程无忧信息时,使用下面的解析方法出现了信息丢失的问题:

html = BeautifulSoup(result,"lxml")

经过查询CSDN博客,发现是’lxml’解析页面时出的问题,故此改用下面方法:

html = BeautifulSoup(result,"html.parser") #因为使用'lxml'会导致内容丢失,故此使用'html.parser'

虽然效率可能会比’lxml’低一些,但是不会有信息丢失的问题了。

下面是博客链接地址：

BeautifulSoup解析页面造成信息丢失的解决办法 - CSDN博客

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

python爬虫里信息提取的核心方法: Beautifulsoup Xpath 正则表达式
20170531 这几天重新拾起了爬虫，算起来有将近5个月不碰python爬虫了。对照着网上的程序和自己以前写的...
八神苍月阅读 14,371评论 3赞 44
Python3爬虫神器之BeautifulSoup（一）——初识美味的汤
BeautifulSoup是一个可以从HTML和XML中提取数据的Python库，BeautifulSoup化平淡...
孤魂游阅读 2,443评论 0赞 8

变形金刚洋画:共和路大版B
时间太少阅读 514评论 0赞 0
PostgreSQL 源码解读（1）- 插入数据#1
本文简单介绍了PG插入数据部分的源码，主要是PageAddItemExtended函数的逻辑，同时结合先前介绍的页...
EthanHe阅读 3,445评论 5赞 7
和弗兰克学写作第十期+致茫然失措的自己+2/6
世上有一样东西，比任何别的东西都更忠诚于你，那就是经历。今年风华正茂的嫂子因癌症，眼睁睁的从我眼皮底下抽手离去，...
竹筒岁月阅读 503评论 6赞 8

友情链接更多精彩内容

赞1赞

赞赏

手机看全文