re.sub

re.sub比replace好用太多了
比如,去掉下面的a标签

import re
test_str = '''
<li data-view="7”>
<a href =”/ 2.mp3 singer =”任贤齐”>沧海一卢笑 </a>
</li> 
<li data-view="7”>
<a href =”/ 2.mp3 singer =”任贤齐”>沧海一卢笑 </a>
</li> 
<li data-view="7”>
<a href =”/ 2.mp3 singer =”任贤齐”>沧海一卢笑 </a>
</li> 
'''
result = re.sub('<a.*?>|</a>','',test_str)
print(result)

结果如下

<li data-view="7”>
沧海一卢笑 
</li> 
<li data-view="7”>
沧海一卢笑 
</li> 
<li data-view="7”>
沧海一卢笑 
</li> 

先使用sub处理一下然后在提取数据可能会达到事半功倍的效果.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。