1、什么是BeautifulSoup?
灵活又方便的网页解析库,处理高效、支持多种解析器。利用它不用编写正则表达式即可方便的实现网页信息的提取。
2、安装方式
pip3 install beautifulsoup4
3、用法详解
3.1、标签选择器
选择特性:只返回匹配的第一个结果
使用contents返回所有子节点的列表
使用children返回子节点的迭代器
使用descendants获取子孙节点的迭代器
最后会返回整个文档的内容
3.2、标准选择器
只使用标签选择器有时候是远远不够的,所以可以使用标准选择器。
返回text的内容: