HTTP定义
HTTP构建于TCP/IP协议之上,默认端口号是80。一般来说,由HTTP客户端发起一个请求,创建一个到服务器指定端口(默认是80端口)的TCP连接。HTTP服务器则在那个端口监听客户端的请求。一旦收到请求,服务器会向客户端返回一个状态,比如"HTTP/1.1 200 OK",以及返回的内容,如请求的文件、错误消息、或者其它信息。
HTTP请求方法有多种,一般常用的是GET,POST,PUT,DELETE。
每个请求一般包括以下内容
请求报文(请求行,请求头部,空行,请求包体)
- 请求行
由请求方法字段、URL 字段 和HTTP 协议版本字段 3 个部分组成,他们之间使用空格隔开。常用的 HTTP 请求方法有 GET、POST。 - 请求头部
为请求报文添加了一些附加信息,由“key/value”对组成,每行一对,请求头部通知服务器有关于客户端请求的信息,典型的请求头有:如,User-Agent --- 请求的浏览器类型 - 空行
表示最后一个请求头部之后是一个空行,发送回车符和换行符,通知服务器以下不再有请求头部,因为头部是由多个“key/value”对组成,空行的作用表示结束。 - 请求包体
请求包体不在GET方法中使用,而是POST方法中使用。
GET方法的请求报文示例
需要注意的是, GET 和 POST 的一个主要区别是请求附带的数据一个在URL里,一个在 HTTP 包的请求包体里,POST请求附带的数据一般支持form、json、xml等数据格式。这个格式由请求头部
Content-Type
来规定。
响应报文(状态行,响应头部,空行,响应包体)
由状态行、响应头部、空行、响应包体4个部分组成。
- 状态行
由HTTP 协议版本字段、状态码(如404)和状态码的描述文本3个部分组成 - 响应头部
由“key/value”对组成,每行一对 - 空行
最后一个响应头部之后是一个空行,发送回车符和换行符,通知服务器以下不再有响应头部。 - 响应包体
服务器返回给客户端的文本信息。
响应报文示例
Keep-Alive模式
由上面的示例可以看到里面的请求头部和响应头部都有一个key-valueConnection: Keep-Alive
,这个键值对的作用是让HTTP保持连接状态,因为HTTP 协议采用“请求-应答”模式,当使用普通模式,即非 Keep-Alive 模式时,每个请求/应答客户和服务器都要新建一个连接,完成之后立即断开连接(HTTP 协议为无连接的协议);当使用 Keep-Alive 模式时,Keep-Alive 功能使客户端到服务器端的连接持续有效。
在HTTP 1.1版本后,默认都开启Keep-Alive模式,只有加入加入 Connection: close
才关闭连接,当然也可以设置Keep-Alive模式的属性,例如 Keep-Alive: timeout=5, max=100
,表示这个TCP通道可以保持5秒,max=100,表示这个长连接最多接收100次请求就断开。
Keep-Alive模式下如何知道某一次数据传输结束
如果不是Keep-Alive模式,HTTP协议中客户端发送一个请求,服务器响应其请求,返回数据。服务器通常在发送回所请求的数据之后就关闭连接。这样客户端读数据时会返回EOF(-1),就知道数据已经接收完全了。
但是如果开启了 Keep-Alive模式,那么客户端如何知道某一次的响应结束了呢?
以下有两个方法
如果是静态的响应数据,可以通过判断响应头部中的Content-Length 字段,判断数据达到这个大小就知道数据传输结束了。
但是返回的数据是动态变化的,服务器不能第一时间知道数据长度,这样就没有 Content-Length 关键字了。这种情况下,服务器是分块传输数据的,
Transfer-Encoding:chunk
,这时候就要根据传输的数据块chunk来判断,数据传输结束的时候,最后的一个数据块chunk的长度是0。
TCP的Keep Alive
HTTP的Keep-Alive与TCP的Keep Alive,有些不同,两者意图不一样。前者主要是 TCP连接复用,避免建立过多的TCP连接。而TCP的Keep Alive的意图是在于保持TCP连接的存活,就是发送心跳包。隔一段时间给连接对端发送一个探测包,如果收到对方回应的 ACK,则认为连接还是存活的,在超过一定重试次数之后还是没有收到对方的回应,则丢弃该 TCP 连接。
短连接
所谓短连接,及连接只保持在数据传输过程,请求发起,连接建立,数据返回,连接关闭。它适用于一些实时数据请求,配合轮询来进行新旧数据的更替。
长连接
长连接便是在连接发起后,在请求关闭连接前客户端与服务端都保持连接,实质是保持这个通信管道,之后便可以对其进行复用。
它适用于涉及消息推送,请求频繁的场景(直播,流媒体)。连接建立后,在该连接下的所有请求都可以重用这个长连接管道,避免了频繁了连接请求,提升了效率。
使用HTTP建立长连接
当需要建立 HTTP 长连接时,HTTP 请求头将包含如下内容:
Connection: Keep-Alive
如果服务端同意建立长连接,HTTP 响应头也将包含如下内容:
Connection: Keep-Alive
当需要关闭连接时,HTTP 头中会包含如下内容:
Connection: Close
HTTP版本区别
HTTP/1.0与HTTP/1.1
主要体现在长连接与部分发送上面
- 在 HTTP/1.0 时代,每一个请求都会重新建立一个 TCP 连接,一旦响应返回,就关闭连接,这种就是短连接,HTTP/1.1版本就支持Keep-Alive 模式,实现长连接了。
- HTTP 1.1支持只发送header信息(不带任何body信息),如果服务器认为客户端有权限请求服务器,则返回100,否则返回401。客户端如果接受到100,才开始把请求body发送到服务器。这样当服务器返回401的时候,客户端就可以不用发送请求body了,节约了带宽。
HTTP/1.1 与HTTP/2.0
主要体现在多路复用上面。
HTTP2.0使用了多路复用的技术,做到同一个连接并发处理多个请求,而且并发请求的数量比HTTP1.1大了好几个数量级。当然HTTP1.1也可以多建立几个TCP连接,来支持处理更多并发的请求,但是创建TCP连接本身也是有开销的。
支持header数据压缩
支持服务器推送
参考文章
https://hit-alibaba.github.io/interview/basic/network/HTTP.html
https://blog.csdn.net/linsongbin1/article/details/54980801