2019-05-22

爬虫原理

(1)模拟计算机对服务器发起的Request请求

(2)接收服务器端的Response内容并解析、提取所需的信息

HTTP协议:

HTTP协议是Hyper Text

Transfer Protocol(超文本传输协议)的缩写,是用于从万维网(WWW:World Wide Web )服务器传输超文本到本地浏览器的传送协议。在这份协议中:规定了客户端应该按照什么格式给服务器发送请求约定了服务端返回的响应结果应该是什么格式。

HTML知识:

HTML全称Hyper Text Mark-up

Language(超文本标记语言),它不是一种

编程语言,而是一种标记语言 (markup language)。标记语言是一套标记

标签 (markup tag),HTML 使用标记标签来描述网页。

HTML的语法:文本+标签。



©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、测试流程 所有测试的流程大体上是一致的:开始测试前准备-->需求分析-->测试设计(测试计划,测试用例)-->...
    唯美的季节我们依然相爱阅读 7,847评论 0 0
  • 1、什么是接口? 接口是系统与系统之间,模块与模块之间的交互点,根据一些特殊的规则也就是协议来完成数据之间的交互。...
    秦时明月_abdd阅读 310评论 0 0
  • 福布斯全球2000强企业HCL大量员工和商业信息公开暴露近日,UpGuard研究团队发现位列福布斯全球2000强的...
    溪边的墓志铭阅读 95评论 0 0
  • 今日内容 1.IDEA的安装和注册2.IDEA的常用快捷键 IDEA的安装 具体见网址:https://www.j...
    A小毛驴儿阅读 340评论 0 0
  • 今天是姥爷的三七。姨妈们都回来了。在家里姥爷的遗像跟前忍不住难过。唯独姥姥比较平静。心里的难过与孤独都藏在心里。无...
    炸裂的啊哈阅读 68评论 0 1