1.BeautifulSoup简单介绍:
在这里引入一个可以解读html/xml文件的包,BeautifulSoup(引入的时候从bs4中导入,安装的时候按pip install beautifulsoup来安装就可以了)
from bs4 import BeautifulSoup
这个BeautifulSoup库中常用的解释器有如下图:
html.parser(解析html文件)lxml,xmlhtml5lib
可以通过解析的soup对象直接获取对应的元素,下面将做演示:
注释部分内容:
所以一般通过一段内容的类型是否为NavigableString来判断其是不是注释。