240 发简信
IP属地:广东
  • 爬虫学习笔记_聚焦爬虫

    1.概念: 聚焦爬虫,是"面向特定主题需求"的一种网络爬虫程序,它与通用搜索引擎爬虫的区别在于: 聚焦爬虫在实施网页抓取时会对内容进行处理筛选,...

  • 爬虫学习笔记_通用爬虫

    1.通用爬虫框架概念: 通用网络爬虫 是 捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分。主要目的是将互联网上的网页...

  • http权威指南第一章

    HTTP的概述: 1.web资源的定义:web服务器的所有静态,动态文件?(HTML,文本文件,图片文件,视频文件,根据需要生成的软件程...