爬虫学习记录4-BeautifulSoup解析html语句

1.BeautifulSoup简单介绍:

在这里引入一个可以解读html/xml文件的包,BeautifulSoup(引入的时候从bs4中导入,安装的时候按pip install beautifulsoup来安装就可以了)

from bs4 import BeautifulSoup

这个BeautifulSoup库中常用的解释器有如下图:

html.parser(解析html文件)lxml,xmlhtml5lib

解释器


BeautifulSoup元素

可以通过解析的soup对象直接获取对应的元素,下面将做演示:


BeautifulSoup的使用


示例

注释部分内容:


注释部分内容的类型

所以一般通过一段内容的类型是否为NavigableString来判断其是不是注释。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容