BeautifulSoup解析页面造成信息丢失的解决办法

在爬取前程无忧信息时,使用下面的解析方法出现了信息丢失的问题:

html = BeautifulSoup(result,"lxml")

经过查询CSDN博客,发现是’lxml’解析页面时出的问题,故此改用下面方法:

html = BeautifulSoup(result,"html.parser") #因为使用'lxml'会导致内容丢失,故此使用'html.parser'

虽然效率可能会比’lxml’低一些,但是不会有信息丢失的问题了。

下面是博客链接地址:

BeautifulSoup解析页面造成信息丢失的解决办法 - CSDN博客

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容