- HTTP属于TCP/IP 的应用层协议。TCP/IP主要包括以下四层:
应用层
,传输层
,网络层
,链路层
。
- HTTP 协议是以 ASCII 码传输,建立在 TCP/IP 协议之上的应用层规范。规范把 HTTP 请求分为三个部分:状态行、请求头、消息主体(或报文首部,报文主体两部分)
- http报文,用于HTTP协议交互的信息被称为HTTP报文,请求端的HTTP报文就做请求报文,对应响应端的报文称为响应报文。报文由多行(CR+LF作为换行符)数据构成字符串文本。一般分为报文首部和报文主体(报文主体主要是应被发送的主体,不一定存在,下面例子就不存在报主体)。
- 请求报文首部包含请求行,请求首部字段,通用首部字段,实体首部字段,其他
- 响应报文首部包含状态行,响应首部字段,通用首部字段,实体首部字段,其他
请求报文介绍
GET /home/xman/data/tipspluslist?indextype=manht&_req_seqid=0xd8777caa00033ccd HTTP/1.1 请求首部字段
-------------------------------------------------------------------------------------------------------------------------------------
Host: www.baidu.com
Connection: keep-alive
Accept: text/plain, */*; q=0.01
X-Requested-With: XMLHttpRequest
User-Agent: Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/56.0.2924.87 Safari/537.36
Referer: https://www.baidu.com/
Accept-Encoding: gzip, deflate, sdch, br
Accept-Language: zh-CN,zh;q=0.8
Cookie: BAIDUID=0F26197E55F6EFDAFA1F9092614F0CF2:FG=1; 各种首部字段
- 上面例子中请求字段中,第一行GET表示的是请求的访问服务器的类型,称为方法(method),HTTP/1.1表示的是HTTP版本号,用来提示客服端使用的HTTP协议功能。中间则指明了请求访问的资源对象,最后HTTP/1.1则表示的是协议版本号
- 各种首部字段中的含义分别如下:
1. Host
指明了服务器的域以及服务器监听的tcp端口号(可选,没有指定,默认使用80)。Http/1.1请求中必须指定相应Host,否则会直接返回400。host头指定了应该由哪个网站或是web应用程序来处理一个传入的HTTP请求
2.Connection
决定当前的事务完成后,是否会关闭网络连接。如果该值是“keep-alive”,网络连接就是持久的,不会关闭,使得对同一个服务器的请求可以继续在该连接上完成。持久连接使得多数请求以管线化( pipelining )方式发送成为可能。从前发送请求后需等待并收到响应,才能发送下一个请求。管线化技术出现后,不用等待响应亦可直接发送下一个请求。
3.Accept
请求头用来告知客户端可以处理的内容类型,这种内容类型用MIME类型来表示。借助内容协商机制, 服务器可以从诸多备选项中选择一项进行应用,并使用 Content-Type
应答头通知客户端它的选择。
4.X-Requested-With
用来判断请求是否是异步请求。request.getHeader("x-requested-with"); 为 null,则为传统同步请求,为 XMLHttpRequest,则为 Ajax 异步请求
5.User-Agent
首部包含了一个特征字符串,用来让网络协议的对端来识别发起请求的用户代理软件的应用类型、操作系统、软件开发商以及版本号。
6.Referer
表示的访问的某一个url的网站来源。比如从www.a.com 有一个www.b.com的链接,点击这个链接时,header中的referer就是www.a.com。referer可以用来防盗链,比如我只允许我本人的网站访问某些资源时,在访问的时候,我们可以通过判断referer来决定是否允许继续访问。防止恶意请求,原理与防盗链类似。空referer的来源主要是用户直接输入地址访问某个网站会出现。
7.Accept-Encoding
会将客户端能够理解的内容编码方式——通常是某种压缩算法——进行通知。通过内容协商的方式,服务端会选择一个客户端提议的方式,使用并在响应报文首部 Content-Encoding
中通知客户端该选择。
8.Accept-Language
请求头允许客户端声明它可以理解的自然语言,以及优先选择的区域方言。
9.HTTP Cookie
(也叫Web Cookie或浏览器Cookie)是服务器发送到用户浏览器并保存在本地的一小块数据,它会在浏览器下次向同一服务器再发起请求时被携带并发送到服务器上。通常,它用于告知服务端两个请求是否来自同一浏览器,如保持用户的登录状态。主要用于会话状态管理(如用户登录状态、购物车、游戏分数或其它需要记录的信息),个性化设置(如用户自定义设置、主题等),浏览器行为跟踪(如跟踪分析用户行为等)。头部还有其他多种字段此处只大概介绍上述几种。
响应报文介绍
HTTP/1.1 304 Not Modified
----------------------------------------------------------------------------------------------------------------------------------------
Date: Sat, 28 Apr 2018 09:31:03 GMT
Connection: keep-alive
Server: kws
Last-Modified: Sat, 28 Apr 2018 08:05:33 GMT
ETag: "5ae42b4d-2d4" 各种首部字段
-----------------------------------------------------------------------------------------------------------------------------------------
<html> 报文主体
</html>
- 报文第一行是状态行,包含表明响应结果的状态码,原因短语和 HTTP 版本。上诉例子中HTTP 304 未改变说明无需再次传输请求的内容,也就是说可以使用缓存的内容。其中HTTP 响应码有1xx,2xx,3xx,4xx,5xx均有具体含义,次数不在详细说明。
- 各种首部字段大概含义如下:
-
Date
是一个通用首部,其中包含了消息生成的日期和时间。
-
Connection
与请求报文中的类似。
-
Server
首部包含了处理请求的源头服务器所用到的软件相关信息。
-
Last-Modified
是一个响应首部,其中包含源头服务器认定的资源做出修改的日期及时间。 它通常被用作一个验证器来判断接收到的或者存储的资源是否彼此一致。由于精确度比 ETag
要低,所以这是一个备用机制。
-
ETag HTTP
响应头是资源的特定版本的标识符。这可以让缓存更高效,并节省带宽,因为如果内容没有改变,Web服务器不需要发送完整的响应。而如果内容发生了变化,使用ETag有助于防止资源的同时更新相互覆盖(“空中碰撞”)。
如果给定URL中的资源更改,则一定要生成新的Etag值。 因此Etags类似于指纹,也可能被某些服务器用于跟踪。 比较etags能快速确定此资源是否变化,但也可能被跟踪服务器永久存留。
- 报文主体表示的是返回的数据。