HTTP报文详解

引言:学习Web测试不好好学习HTTP报文,将会“打拳不练功,到老一场空”,你花在犯迷糊上的时间远比你沉下心来学习HTTP的时间会多很多。

HTTP请求报文解剖 

HTTP请求报文由3部分组成(请求行+请求头+请求体): 


下面是一个实际的请求报文:


①是请求方法,GET和POST是最常见的HTTP方法,除此以外还包括DELETE、HEAD、OPTIONS、PUT、TRACE。不过,当前的大多数浏览器只支持GET和POST。 

②为请求对应的URL地址,它和报文头的Host属性组成完整的请求URL,③是协议名称及版本号。 

④是HTTP的报文头,报文头包含若干个属性,格式为“属性名:属性值”,服务端据此获取客户端的信息。 

⑤是报文体,它将一个页面表单中的组件值通过param1=value1的键值对形式编码成一个格式化串,它承载多个请求参数的数据。不但报文体可以传递请求参数,请求URL也可以通过类似于“/chapter15/user.html? param1=value1”的方式传递请求参数。

对照上面的请求报文,我们把它进一步分解,你可以看到一幅更详细的结构图:


HTTP请求报文头属性 

报文头属性是什么东西呢?我们不妨以一个小故事来说明吧。 

引用

快到中午了,张三丰不想去食堂吃饭,于是打电话叫外卖:老板,我要一份[鱼香肉丝],要12:30之前给我送过来哦,我在江湖湖公司研发部,叫张三丰。

这里,你要[鱼香肉丝]相当于HTTP报文体,而“12:30之前送过来”,你叫“张三丰”等信息就相当于HTTP的报文头。它们是一些附属信息,帮忙你和饭店老板顺利完成这次交易。 

请求HTTP报文和响应HTTP报文都拥有若干个报文头属性,它们是为协助客户端及服务端交易的一些附属信息。 

常见的HTTP请求报文头属性 

Accept 

请求报文可通过一个“Accept”报文头属性告诉服务端 客户端接受什么类型的响应。 

如Accept:text/plain  报文头相当于告诉服务端,客户端能够接受的响应类型仅为纯文本数据,你别发其它什么图片啊,视频啊过来,那样我会歇菜的~~~

Accept属性的值可以为一个或多个MIME类型的值,关于MIME类型,大家请参考:http://en.wikipedia.org/wiki/MIME_type

Cookie 

客户端的Cookie就是通过这个报文头属性传给服务端的哦!如下所示: 

Cookie:PHPSESSID=e2d36k11fsdofsiul8pe6iqfiv

服务端是怎么知道客户端的多个请求是隶属于一个Session呢?注意到后台的那个PHPSESSID=e2d36k11fsdofsiul8pe6iqfiv   原来就是通过HTTP请求报文头的Cookie属性的PHPSESSID的值关联起来的!

Referer 

表示这个请求是从哪个URL过来的,假如你通过google搜索出一个商家的广告页面,你对这个广告页面感兴趣,鼠标一点发送一个请求报文到商家的网站,这个请求报文的Referer报文头属性值就是http://www.google.com。 

举例:

唐僧到了西天. 

如来问:侬是不是从东土大唐来啊? 

唐僧:厉害!你咋知道的! 

如来:呵呵,我偷看了你的Referer... 

Cache-Control 

对缓存进行控制,如一个请求希望响应返回的内容在客户端要被缓存一年,或不希望被缓存就可以通过这个报文头达到目的。 

如以下设置,相当于让服务端将对应请求返回的响应内容不要在客户端缓存:

Cache-Control: no-cache  

其它请求报文头属性 

参见:http://en.wikipedia.org/wiki/List_of_HTTP_header_fields

HTTP响应报文解剖 

响应报文结构 

HTTP的响应报文也由三部分组成(响应行+响应头+响应体): 

以下是一个实际的HTTP响应报文: 

①报文协议及版本; 

②状态码及状态描述; 

③响应报文头,也是由多个属性组成; 

④响应报文体,即我们真正要的“干货”。 

响应状态码 

和请求报文相比,响应报文多了一个“响应状态码”,它以“清晰明确”的语言告诉客户端本次请求的处理结果。 

HTTP的响应状态码由5段组成: 

1xx 消息,一般是告诉客户端,请求已经收到了,正在处理,别急...

2xx 处理成功,一般表示:请求收悉、我明白你要的、请求已受理、已经处理完成等信息.

200 OK 

你最希望看到的,即处理成功! 

3xx 重定向到其它地方。它让客户端再发起一个请求以完成整个处理。

303 See Other

我把你redirect到其它的页面,目标的URL通过响应报文头的Location告诉你。 

引用

悟空:师傅给个桃吧,走了一天了/(ㄒoㄒ)/~~

唐僧:我哪有桃啊!去王母娘娘那找吧!

4xx 处理发生错误,责任在客户端,如客户端的请求一个不存在的资源,客户端未被授权,禁止访问等。

404 Not Found

你最不希望看到的,即找不到页面。如你在google上找到一个页面,点击这个链接返回404,表示这个页面已经被网站删除了,google那边的记录只是美好的回忆。

5xx 处理发生错误,责任在服务端,如服务端抛出异常,路由出错,HTTP版本不支持等。

500 Internal Server Error 

看到这个错误,你就应该查查服务端的日志了,肯定抛出了一堆异常。

常见的HTTP响应报文头属性

Cache-Control 

响应输出到客户端后,服务端通过该报文头属告诉客户端如何控制响应内容的缓存。 

下面的设置让客户端对响应内容缓存3600秒,也即在3600秒内,如果客户再次访问该资源,直接从客户端的缓存中返回内容给客户,不要再从服务端获取(当然,这个功能是靠客户端实现的,服务端只是通过这个属性提示客户端“应该这么做”,做不做,还是决定于客户端,如果是自己宣称支持HTTP的客户端,则就应该这样实现)。 

Cache-Control: max-age=3600  

Set-Cookie 

服务端分配给客户端的Cookie

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一、HTTP协议 1.简介 HTTP协议(Hyper Text Transfer Protocol,超文本传输协议...
    五维思考阅读 1,570评论 0 0
  • 本文仅供笔者平日学习笔记之用,侵删原文:https://mp.weixin.qq.com/s/wZONAYSlku...
    longLiveData阅读 1,204评论 0 0
  • URL 的语法 :// : @<host>: / ; ? #<frag> 报文的语法 请求报文 响应报文 方法(m...
    何锦余阅读 1,757评论 0 0
  • HTTP工作原理 一、报文的组成 HTTP报文大致分为报文首部和报文主体两块,中间用空行来划分。通常,不一定有报文...
    黄露hl阅读 12,937评论 1 5
  • TCP报文详解 控制位:URG ACK PSH RST SYN FIN,共6个,每一个标志位表示一个控制功能。 1...
    任嘉平生愿阅读 2,252评论 0 0