Beautiful
优点
不用担心编码方式的问题 ,因为已经内置处理好了,会自动将输入文档转换Unicode编码,输出转换UTF-8编码
#基本用法

#选择元素
- 通过标签选择
- 通过CSS选择器选择
- 获取属性
attrs - 获取文本
get_text()
- 获取属性
- 方法选择器
-
find()返回单个元素 find_parents()find_parent()find_next_siblings()find_next_siling()
-

#提取信息
- 获取标签信息
name字符串 - 获取文本信息
string字符串 - 获取属性信息
attrs字典

#嵌套选择
print(soup.head.title)
#关联选择
- 子节点与子孙节点
contents/children | descendants - 父节点与祖先节点
parent| parents - 兄弟节点
-
next_sibling下一个兄弟节点 -
next_siblings所有后面的兄弟节点 -
previous_sibling上一个兄弟节点 -
previous_siblings所有前面的兄弟节点
-