一.简介
http是基于tcp/ip传输协议的一个超文本,无状态的应用协议。设计http协议的目的是能够方便高效的传输html数据。默认用80端口。
一个www.baidu.com的过程
1.对baidu.com的网址进行dns解析
2.解析出ip地址,找到对应的服务器。
3.建立tcp连接
4.通过http协议传输文本信息到服务器
5.服务器接收消息,通过http协议返回html
6.浏览器解析html,并请求静态资源
7.浏览器进行渲染。
二.http的历史
http最开始是0.9版本,只支持get
http1.0支持了很多功能 并且规范了请求header信息。
那时候一个tcp连接就处理一个http请求,并且请求结束后断开tcp。
这时候的缺点是 一个tcp只能处理一个http请求,随着请求量增加,每次建立tcp会产生大量网络开销,性能差。
http1.1的发展支持了tcp keep-alive,并且使用管道技术,以前http请求需要等上次请求完成后才能发下一个请求。运用管道技术,可以不用等上次请求返回再发下次请求。例如:
同一个tcp连接
client ->A请求->服务端
client->B请求->服务端
服务端->A回应->client
服务端->B回应->client
缺点:http1.1虽然实现了tcp连接复用,但是如果出现A请求处理过长,后续的请求还是会进行阻塞,也叫头阻塞。而且http1.1的头报文每行还是会有无数据意义的换行符,浪费网络带宽。
http2
二进制
我们知道http1.1的头信息编码肯定是ASCII码,数据传输可以是文本也可以是二进制。http2是完完全全的二进制协议传输。http2的二进制数据统称为帧(frame),二进制定义帧含义,解析方便。
多工
http2是复用tcp连接,用的是二进制帧传输,不用保证数据传输顺序,多个请求可以同时请求。
举例来说,在一个TCP连接里面,服务器同时收到了A请求和B请求,于是先回应A请求,结果发现处理过程非常耗时,于是就发送A请求已经处理好的部分, 接着回应B请求,完成后,再发送A请求剩下的部分。
这样双向的、实时的通信,就叫做多工。
数据流
数据流不用保证顺序,那就得标记哪个数据包是哪个请求的,所以就需要标记数据id。规定客户端是奇数,服务端是偶数。并且可以在不断开tcp连接的情况下发送信号断开数据流。
数据压缩
http2也对对头信息进行压缩,并且客户端和服务端都维护了一个头信息hash表,这样每次传输只用传索引号就行了。节省网络带宽,提供速度。
服务器主动推送
对于浏览器解析服务器返回的html后,需要请求静态资源。http2考虑到浏览器可能会去请求静态资源,所以在返回html的时候,主动吧静态资源推送给浏览器。
三.https
https是为了保证传输数据的安全性提出的对于http加密的方式。实际上是在http传输过程中加了一层SSL,是对tcp数据包的加密。
https的请求流程
1.浏览器把自己支持的加密算法,ssl版本号发给服务端
2.服务端接受后向客户端发送加密算法,ssl版本号确认是否支持。
服务端把证书和公钥都发给浏览器
3.浏览器验证证书是否ok,成功后,随机生成一个预见秘钥,并用公钥对其加密发送服务端。
4.服务端接收到加密后预见秘钥后用CA的私钥对其解密,解密后,计算出会话秘钥。
5.客户端也自己计算出会话秘钥。
6.服务端计算完后就通知客户端可以用会话秘钥传输数据了。