爬虫的基本原理

什么是爬虫?


请求网站并提取数据的自动化程序

爬虫基本流程


  1. 发起请求(request)
  2. 获取响应内容(response)
  3. 解析内容(html)
  4. 保存数据
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 国家电网公司企业标准(Q/GDW)- 面向对象的用电信息数据交换协议 - 报批稿:20170802 前言: 排版 ...
    庭说阅读 13,872评论 6 13
  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 135,508评论 19 139
  • scrapy学习笔记(有示例版) 我的博客 scrapy学习笔记1.使用scrapy1.1创建工程1.2创建爬虫模...
    陈思煜阅读 14,371评论 4 46
  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 175,703评论 25 709
  • 我梦见自己 跑啊跑啊 拚命地奔跑 却把灵魂弄丢了 它在后面大声呼喊 等等我,等等我 没有我,你不过是行尸走肉 可我...
    史海_孤舟阅读 1,846评论 3 2