1、什么是BeautifulSoup?
灵活又方便的网页解析库,处理高效、支持多种解析器。利用它不用编写正则表达式即可方便的实现网页信息的提取。
2、安装方式
pip3 install beautifulsoup4
3、用法详解
初识beautifulsoup
基本使用方法
运行结果
3.1、标签选择器
选择特性:只返回匹配的第一个结果
选择元素
获取名称
获取属性
获取内容
嵌套选择
使用contents返回所有子节点的列表
子节点和孙节点
使用children返回子节点的迭代器
子节点
使用descendants获取子孙节点的迭代器
子孙节点
获取父节点
最后会返回整个文档的内容
获取祖先节点
获取兄弟节点
3.2、标准选择器
只使用标签选择器有时候是远远不够的,所以可以使用标准选择器。
标准选择器
第一个参数
嵌套使用
第二个参数
attrs的等价方式
返回text的内容:
第四个参数
find方法
其他类似的方法
3.3、CSS选择器
CSS选择器
嵌套选择
获取属性
获取内容
4、总结
总结