本系列翻译自:https://developer.mozilla.org/en-US/docs/Web/HTTP
注:翻译水平有限,如果有不理解或者纰漏之处,还请参考火狐原文 :https://developer.mozilla.org/en-US/docs/Web/HTTP/Messages;
HTTP 消息是关于客户端和服务端如何交互数据的信息;有两类消息:客户端发送请求到服务端,及来自服务端的响应;
HTTP 消息是由文本信息参照ASCII编码而组成的,并且是多行组成。在HTTP/1.1以及早期的版本,消息是开放的,而在HTTP/2中,曾经可读的消息现在被划分为HTTP框架,提供优化和性能的改进。Web开发人员或网站管理员很少亲自编写这些文本HTTP消息:软件、Web浏览器、代理或Web服务器,执行此操作。它们通过配置文件(代理或服务器)、API(浏览器)或其他接口提供HTTP消息。
HTTP/2的是一种不需要对api或者配置文件做任何更改的二进制框架机制,它对用户是透明的。
HTTP requests和responses都是由大致相同的结构组成:
- 起始行描述了请求是否被处理,处理的结果是成功还是失败,起始行永远是单行;
- 一系列可选的header头也是构成请求的一部分,或者描述消息体;
- 一个空白行揭示了所有元信息已经被发送出去。
- 一个可选的正文包含了类似于表单的请求,或者是响应的文档。
HTTP消息的起始行和HTTP头统称为请求头,而其有效负载称为主体。
HTTP Requests
Start line:起始行
HTTP请求是客户端发送的消息,用于在服务器上发起动作。起始行包含三个要素:
1. 一个HTTP方法,一个动词(如GET
/PUT
POST
)或名词(如HEAD
或 OPTIONS
),这用于描述要执行的动作。例如,GET表明资源被获取或POST意味着数据被推送到服务器。
2. 请求的目标,通常用 URL或者指定绝对路径、协议、端口、域名;请求的格式取决于不同的请求方法,可以是:
- 一个绝对路径,后面跟着一个“?”和query串,这是最常见的形式,称作 origin form 被GET, POST, HEAD,和OPTIONS方法使用。
POST / HTTP 1.1
GET /background.png HTTP/1.0
HEAD /test.html?query=alibaba HTTP/1.1
OPTIONS /anypage.html HTTP/1.0 - 一个完整的URL,被称为绝对形式 absolute form,主要用户get请求连接到代理。
GET http://developer.mozilla.org/en-US/docs/Web/HTTP/Messages HTTP/1.1
- URL的权威组件,由域名和可选的端口构成(用':'隔开),被称作权威形式 authority form,它仅仅用CONNECT建立HTTP隧道;
CONNECT developer.mozilla.org:80 HTTP/1.1
- 星号形式 asterisk form,一个简单的星号(“*”)与OPTIONS一起使用,代表整个服务器。
OPTIONS * HTTP/1.1
3. HTTP版本,定义了消息的结构,以及指示如何响应。
Headers 头
HTTP headers 是从请求中继承了一个HTTP头的基本结构:一个不区分大小写的字符串,后跟一个冒号(“:”)和一个值,其结构取决于头。一行组成,可以相当长。
请求头有很多,分为这么几组:
General headers 通用头:比如
Via
,作为整体在消息中其作用。Request headers 请求头,如
User-Agent
,Accept-Type
,通过指定进一步修改请求(如Accept-Language
),通过上下文(如Referer
),或有条件的限制(如If-None
))。Entity headers 实体头,比如
Content-Length
,显然,如果请求中没有主体,就不会发送这样的报头。
Body 请求正文
Request 的最后一部分是请求正文,并不是所有的请求都有请求正文,如GET/HEAD/DELETE就没有,但是像POST因为是需要更新资源,所以一般会有请求正文。
请求正文大概被分为这么两种:
单个资源(Single-resource)体,由一个单独的文件组成,由两个头定义:
Content-Type
andContent-Length
.多个资源体(Multiple-resource bodies), 由multipart 类型的请求正文组成,一般是HTTP表单。
HTTP Responses
Start line:起始行
response的起始行被称为状态行,包含了以下信息:
如 HTTP/1.1 404 Not Found.
Headers 头部
HTTP headers 响应的HTTP头遵循与其他头一样的结构:一个不区分大小写的字符串,后跟一个冒号(“:”)和一个value,其结构取决于头的类型,一行显示。
响应头分为这么几组:
General headers, 比如
Via
.Response headers, 比如
Vary
和Accept-Ranges
Entity headers, 比如
Content-Length
, 应用于请求正文. 显然,在请求中没有正文时,不会发送这样的标头。
Body 响应体
response 的最后一部分是响应体 。不是所有的response 都有响应体 :比如201或204,就没有。
响应体分为这么几种:
Single-resource bodies, 由单个文件的已知长度组成,被两个头所定义:
Content-Type
和Content-Length
.Single-resource bodies, , 由单个文件的未知长度组成, 由
Transfer-Encoding
指定编码,并设置到chunked
.Multiple-resource bodies, 由multipart 类型的响应体组成, 这种比较少见.
HTTP/2 Frames
HTTP/1.x 的messages 有一些缺点:
Headers没有被压缩
Headers are often very similar from one message to the next one, yet still repeated across connections.
No multiplexing can be done. Several connections need opening on the same server: and warm TCP connections are more efficient than cold ones.
(注:以上两点把握不太准,自行参考)
HTTP / 2引入了一个额外的步骤:将HTTP/1.x消息分为帧,数据和header头分离,这样就可以对header进行压缩了,几个流可以组合在一起,称为多路复用,可以使用更有效的底层tcp连接。
HTTP框架现在对Web开发人员来说是开放的。这是在HTTP / 1.1消息和底层传输协议之间的HTTP 2中的一个额外步骤。Web开发人员使用HTTP帧的API时不需要更改;在浏览器和服务器中都可用时。