【原创】Beautifulsoup如何只提取标签内的文本

示例

如下代码，只提取div里的文本，不提取span里的文本


from bs4 import BeautifulSoup

s='''
<div>
<span> 添加时间:</span>
" 26分钟前"
<br>
<span> 作者:</span>
" 陈冠希"
<br>
</div>
'''

soup=BeautifulSoup(s,'html5lib')
div=soup.find('div')
print([text.strip() for text in div.find_all(text=True) if text.parent.name !='span' and text.strip()])

输出结果

最后编辑于：2020.01.16 09:03:39

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

浏览器的工作原理：新式网络浏览器幕后揭秘
简介网络浏览器很可能是使用最广的软件。在这篇入门文章中，我将会介绍它们的幕后工作原理。我们会了解到，从您在地址栏输...
wengjq阅读 2,311评论 2赞 15
九、DOM
DOM（文档对象模型）是针对 HTML 和 XML 文档的一个 API（应用程序编程接口）。 DOM 描绘...
霜天晓阅读 3,866评论 0赞 7

2018-06-22
爷爷昨天考试了，考的十分慌乱。前天晚上也没睡好，所以昨天晚上特别困，一闭眼就睡着了，昨天没有跟你聊天你想我...
Chen豆豆阅读 104评论 0赞 0
你会在喝水的时候想起我吗
就在刚才接水喝的时候，突然想起了有的人的淡 —— 不知道到底喜欢吃哪些东西，但感觉着，应该会是...
卜蝶阅读 380评论 0赞 4
睡前争宠
爸爸：宝贝来，给我抱一下～宝贝：不要，我要给你卖去“你好”那边，叫老板给你弄漂亮点，你太丑了爸爸：把我卖掉你...
屿西在成长阅读 83评论 0赞 0

友情链接更多精彩内容

赞1赞

赞赏

手机看全文