1、什么是BeautifulSoup?
灵活又方便的网页解析库,处理高效、支持多种解析器。利用它不用编写正则表达式即可方便的实现网页信息的提取。
2、安装方式
pip3 install beautifulsoup4
3、用法详解

初识beautifulsoup

基本使用方法

运行结果
3.1、标签选择器
选择特性:只返回匹配的第一个结果

选择元素

获取名称

获取属性

获取内容

嵌套选择
使用contents返回所有子节点的列表

子节点和孙节点
使用children返回子节点的迭代器

子节点
使用descendants获取子孙节点的迭代器

子孙节点

获取父节点
最后会返回整个文档的内容

获取祖先节点

获取兄弟节点
3.2、标准选择器
只使用标签选择器有时候是远远不够的,所以可以使用标准选择器。

标准选择器

第一个参数

嵌套使用

第二个参数

attrs的等价方式
返回text的内容:

第四个参数

find方法

其他类似的方法
3.3、CSS选择器

CSS选择器

嵌套选择

获取属性

获取内容
4、总结

总结