06-数据提取-概念和分类

爬虫中数据的分类:
  • 结构化数据:json,xml等
    json:可以通过键值对获取的数据
    处理方式:json、jsonpath
  • 非结构化数据:HTML,字符串
    没有规律
    处理方式:re、xpath、bs4
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 目录清单 正则表达式提取数据 正则表达式案例操作 Xpath提取数据 Xpath案例操作 BeautifulSou...
    云Shen不知处阅读 3,579评论 0 0
  • 上网原理 1、爬虫概念 爬虫是什麽? 蜘蛛,蛆,代码中,就是写了一段代码,代码的功能从互联网中提取数据 互联网: ...
    riverstation阅读 8,304评论 1 2
  • 爬虫处理之结构化数据操作 目录清单 1.正则表达式提取数据 2.正则表达式案例操作 1.Xpath提取数据 Xpa...
    super_paul阅读 795评论 0 0
  • 目录清单 正则表达式提取数据 正则表达式案例操作 Xpath提取数据 Xpath案例操作 BeautifulSou...
    卢子野阅读 545评论 5 4
  • 浮屠镇与浮屠路 小时候我做了很多的梦,梦到我从屋后的楼梯里坠入长长而黑暗的洞里;也常梦到北国的傲人...
    袁沐槿阅读 241评论 0 2