爬虫之BeautifulSoup(一)--安装与基本语法

  1. 安装BeautifulSoup
    使用管理员模式进行pip下载安装
    pip install beautifulsoup4
    此时安装的模块所在的路径为:C:\Program Files\Python36\Lib\site-packages

  2. 导入BeautifulSoup
    from bs4 import BeautifulSoup

  3. 使用基本语句

demo = r. text   # 其中r为通过requests获取的信息
soup = BeautifulSoup(demo,"html.parser") 
print(soup.prettify())
Beautiful Soup库解析器

此时soup可以作为一个BeautifulSoup类,该类作为html或者xml文档的全部内容。


Beautiful Soup类的基本元素
soup.title   # soup的title标签
soup.a     # soup的a标签
soup.a.name   # 标签a的名字
soup.a.attrs     #字典格式的属性列表
soup.a.string   # 非属性字符串
# 注释中的string与一般标签相同,只显示字符串,
# 无法区分,可以使用type来区分
type(soup.a.string)   # <class 'bs4.element.NavigableString'>
type(soup.b.string)    #<class 'bs4.element.Comment'>
基本元素
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容