BeautifulSoup 库的使用

用于解析、遍历、维护“标签树”的库
用于解析html
from bs4 import BeautifulSoup
import request
r=requests.get("http://www.baidu.com")
demo=r.text #返回的是一个html的文件
soup=BeautifulSoup(demo,'html.parser') #解析html信息

另外一种方式 soup=BeautifulSoup(open('D://demo.html'),'html.parser'))

tag=soup.a #找到a标签
print(tag.attrs['class']) #查看a标签的属性信息
print(tag.string)

用这个网址测试:https://python123.io/ws/demo.html

soup.title

soup.a.parent.name

soup.p.parent.name

image.png
image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 导入所需包 from bs4 import BeautifulSoup soup = BeautifulSoup...
    野狗子嗷嗷嗷阅读 4,178评论 0 0
  • Beautiful Soup是一个可以从HTML或XML文件中提取数据的Python库.它能够通过你喜欢的转换器实...
    LitOrange阅读 5,321评论 0 4
  • 对象的种类BeautifulSoup会将HTML文档抓换成一个树形结构, 每个节点都是Python对象,所有对象可...
    寒剑飘零阅读 612评论 0 1
  • 关于bs4,官方文档的介绍已经非常详细了,传送:Beautifulsoup 4官方文档,这里我把它组织成自己已经消...
    徐薇薇阅读 5,488评论 0 1
  • 梦到我把竹筐向地上扔去 水哗哗地流出,鱼,水草,镰刀 以及云的影子 各自不慌不忙地向竹篮外 游,长,切割以及飘动时...
    李榆阅读 453评论 16 14