Http-超文本传输协议

HTTP简介

HTTP协议是Hyper Text Transfer Protocol(超文本传输协议)的缩写,是用于从万维网上(WWW:World Wide Web)服务器传输超文本到本地浏览器的传送协议。
HTTP是一个基于TCP/IP通信协议来传递数据(HTML文件,图片文件,查询结果等)。

HTTP工作原理

HTTP协议工作于客户端——服务端架构之上。浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求。
HTTP默认端口号为80,但是你也可以改为8080或者其他端口。

WEB服务器分类

Web服务器有:Apache服务器,IIS服务器(Internet Information Services)等。

WEB服务器工作原理

Web服务器根据接收到的请求后,向客户端发送响应信息。

HTTP三点注意事项

  • HTTP是无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户端的应答后,即断开连接。采用这种方式可以节省传输时间。
  • HTTP是媒体独立的:这意味着,只要客户端和服务器知道如何处理的数据内容,任何类型的数据都可以通过HTTP发送。客户端以及服务器指定使用适合的MIME-type内容类型。
  • HTTP是无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接的数据量增大。另一个方面,在服务器不需要先前信息时它的应答就比较快。

HTTP通信协议流程UML:

这里写图片描述

HTTP消息结构简介

HTTP是基于客户端/服务端(C/S)的架构模式,通过一个可靠的链接来交换信息,是一个无状态的请求/响应协议。
一个HTTP“客户端”是一个应用程序(Web浏览器或其他任何客户端),通过连接到服务器达到想服务器发送一个或多个HTTP的请求目的。
一个HTTP“服务器”同样也是一个应用程序(通常是一个Web服务,如Apache Web服务器或IIS服务器等),通过接收客户端的请求并向客户端发送HTTP响应数据。
HTTP使用统一资源标识符(Uniform Resource Identifiers, URI)来传输数据和建立连接。
一旦建立连接后,数据消息就通过类似Internet邮件所使用的格式[RFC5322]和多用途Internet邮件扩展(MIME)[RFC2045]来传送。

客户端请求消息

客户端发送一个HTTP请求到服务器的请求消息包括以下格式:请求行(request line)、请求头部(header)、空行和请求数据四个部分组成,下面给出请求报文的一般格式。

请求行:请求方法   空格  URL  空格 协议版本  回车符 换行符

请求头部:  头部字段名:值 回车符 换行符
回车符 换行符
请求数据........

服务器响应消息

HTTP响应也是由四个部分组成的,分别是:状态行、消息报头、空行、和响应正文。

-------------------状态行----------------
HTTP/1.1 200 OK
-------------------消息报头--------------
Date:Sat, 31 Dec 2017 00:00:00 GET
Content-Type: text/html;charset=ISO-8859-1
Content-Length:122
-------------------空行----------------

-------------------响应正文--------------
<html>
 <head>
    <title>Hello Word</title>
 </head>
 <body>
    <!--body goes here-->
 </body>
</html>

实例

使用GET来传递数据的实例:

客户端请求

GET /hello.txt HTTP/1.1
User-Agent: curl/7.16.3 libcurl/7.16.3 OpenSSL/0.9.7l zlib/1.2.3
Host: www.example.com
Accept-Language: en, mi

服务器响应

HTTP/1.1 200 OK
Date: Mon, 27 Jul 2017 12:28:53 GMT
Server: Apache
Last-Modified: Wed, 22 Jul 2009 19:15:56 GMT
ETag: "34aa387-d-1568eb00"
Accept-Ranges: bytes
Content-Length: 51
Vary: Accept-Encoding
Content-Type: text/plain

输出结果

Hello World! My payload includes a trailing CRLF.

HTTP请求方法

根据HTTP标准,HTTP请求可以使用多种请求方法。
HTTP1.0定义了三种请求方法: GET, POST 和 HEAD方法。
HTTP1.1新增了五种请求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。


这里写图片描述

HTTP响应头信息

HTTP请求头提供了关于请求,响应或者其他的发送实体的信息。

  • Allow(允许):服务器支持哪些请求方法(如GET、POST等)。

  • Content-Encoding(内容编码):文档的编码(Encode)方法。只有在解码之后才可以得到Content-Type头指定的内容类型。利用gzip压缩文档能够显著地减少HTML文档的下载时间。Java的GZIPOutputStream可以很方便地进行gzip压缩,但只有Unix上的Netscape和Windows上的IE 4、IE 5才支持它。因此,Servlet应该通过查看Accept-Encoding头(即request.getHeader("Accept-Encoding"))检查浏览器是否支持gzip,为支持gzip的浏览器返回经gzip压缩的HTML页面,为其他浏览器返回普通页面。

  • Content-Length(内容长度):表示内容长度。只有当浏览器使用持久HTTP连接时才需要这个数据。如果你想要利用持久连接的优势,可以把输出文档写入 ByteArrayOutputStream,完成后查看其大小,然后把该值放入Content-Length头,最后通过byteArrayStream.writeTo(response.getOutputStream()发送内容。

  • Content-Type(内容类型):表示后面的文档属于什么MIME类型。Servlet默认为text/plain,但通常需要显式地指定为text/html。由于经常要设置Content-Type,因此HttpServletResponse提供了一个专用的方法setContentType。

  • Date(日期):当前的GMT时间。你可以用setDateHeader来设置这个头以避免转换时间格式的麻烦。

  • Expires(到期):应该在什么时候认为文档已经过期,从而不再缓存它?

  • Last-Modified:文档的最后改动时间。客户可以通过If-Modified-Since请求头提供一个日期,该请求将被视为一个条件GET,只有改动时间迟于指定时间的文档才会返回,否则返回一个304(Not Modified)状态。Last-Modified也可用setDateHeader方法来设置。

  • Location(位置):表示客户端应当到哪里去提取文档。Location通常不是直接设置的,而是通过HttpServletResponse的sendRedirect方法,该方法同时设置状态代码为302。

  • Refresh(刷新):表示浏览器应该在多少时间之后刷新文档,以秒计。除了刷新当前文档之外,你还可以通过setHeader("Refresh", "5; URL=http://host/path")让浏览器读取指定的页面。
    注意这种功能通常是通过设置HTML页面HEAD区的<META HTTP-EQUIV="Refresh" CONTENT="5;URL=http://host/path">实现,这是因为,自动刷新或重定向对于那些不能使用CGI或Servlet的HTML编写者十分重要。但是,对于Servlet来说,直接设置Refresh头更加方便。
    注意Refresh的意义是"N秒之后刷新本页面或访问指定页面",而不是"每隔N秒刷新本页面或访问指定页面"。因此,连续刷新要求每次都发送一个Refresh头,而发送204状态代码则可以阻止浏览器继续刷新,不管是使用Refresh头还是<META HTTP-EQUIV="Refresh" ...>。

    注意Refresh头不属于HTTP 1.1正式规范的一部分,而是一个扩展,但Netscape和IE都支持它。

  • Server(服务器):服务器名字。Servlet一般不设置这个值,而是由Web服务器自己设置。

  • Set-Cookie(设置Cookie):设置和页面关联的Cookie。Servlet不应使用response.setHeader("Set-Cookie", ...),而是应使用HttpServletResponse提供的专用方法addCookie。参见下文有关Cookie设置的讨论。

  • WWW-Authenticate:客户端应该在Authorization头中提供什么类型的授权信息?在包含401(Unauthorized)状态行的应答中这个头是必需的。例如,response.setHeader("WWW-Authenticate", "BASIC realm=\"executives\"")。
    注意Servlet一般不进行这方面的处理,而是让Web服务器的专门机制来控制受密码保护页面的访问(例如.htaccess)。

HTTP状态码

当浏览者访问一个网页时,浏览者的浏览器会向所在的服务器发出请求。当浏览器接收并显示网页前,此网页所在的服务器会返回一个包含HTTP状态码的信息头(server header)用以响应浏览器的请求。
HTTP状态码的英文为HTTP Status Code。

常见的HTTP状态码:

  • 200——请求成功
  • 301——资源(网页等)被永久转移到其它URL
  • 404——请求的资源(网页等)不存在
  • 500——内部服务器错误

HTTP状态码分类

HTTP状态码由三个十进制数字组成,第一个十进制数字定义了状态码的类型,后两个数字没有分类的作用。HTTP状态码共分为5种类型:

  • 1**:信息,服务器收到请求,需要请求者继续执行操作。
  • 2**:成功,操作被成功接收处理。
  • 3**:重定向,需要进一步的操作以完成请求。
  • 4**:客户端错误,请求包含语法错误或无法完成请求。
  • 5**:服务器错误,服务器在处理请求的过程中发生了错误。

可能出现的状态码

状态码   状态码英文名称               中文描述
100     Continue                继续。客户端应继续其请求
101     Switching Protocols     切换协议。服务器根据客户端的请求。

200     OK                      请求成功。一般用于GET与POST请求
201     Created                 已创建。成功请求并创建了新的资源
202     Accepted                已接受。已经接受请求,但未处理完成
203     Non-Authoritative Information   非授权信息。请求成功。但返回的meta信息不在原始的服务器,而是一个副本

204     No Content              无内容。服务器成功处理,但未返回内容。在未更新网页的情况下,可确保浏览器继续显示当前文档

205     Reset Content           重置内容。服务器处理成功,用户终端(例如:浏览器)应重置文档视图。可通过此返回码清除浏览器的表单域

206     Partial Content         部分内容。服务器成功处理了部分GET请求

300     Multiple Choices        多种选择。请求的资源可包括多个位置,相应可返回一个资源特征与地址的列表用于用户终端(例如:浏览器)选择

301     Moved Permanently       永久移动。请求的资源已被永久的移动到新URI,返回信息会包括新的URI,浏览器会自动定向到新URI。今后任何新的请求都应使用新的URI代替

302     Found                   临时移动。与301类似。但资源只是临时被移动。客户端应继续使用原有URI

303     See Other               查看其它地址。与301类似。使用GET和POST请求查看

304     Not Modified            未修改。所请求的资源未修改,服务器返回此状态码时,不会返回任何资源。客户端通常会缓存访问过的资源,通过提供一个头信息指出客户端希望只返回在指定日期之后修改的资源

305     Use Proxy               使用代理。所请求的资源必须通过代理访问

306     Unused                  已经被废弃的HTTP状态码

307     Temporary Redirect      临时重定向。与302类似。使用GET请求重定向

400     Bad Request             客户端请求的语法错误,服务器无法理解

401     Unauthorized            请求要求用户的身份认证

402     Payment Required        保留,将来使用

403     Forbidden               服务器理解请求客户端的请求,但是拒绝执行此请求

404     Not Found               服务器无法根据客户端的请求找到资源(网页)。通过此代码,网站设计人员可设置"您所请求的资源无法找到"的个性页面

405     Method Not Allowed      客户端请求中的方法被禁止

406     Not Acceptable          服务器无法根据客户端请求的内容特性完成请求

407     Proxy Authentication Required   请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权

408     Request Time-out        服务器等待客户端发送的请求时间过长,超时

409     Conflict                服务器完成客户端的PUT请求是可能返回此代码,服务器处理请求时发生了冲突

410     Gone                    客户端请求的资源已经不存在。410不同于404,如果资源以前有现在被永久删除了可使用410代码,网站设计人员可通过301代码指定资源的新位置

411     Length Required         服务器无法处理客户端发送的不带Content-Length的请求信息

412     Precondition Failed     客户端请求信息的先决条件错误

413     Request Entity Too Large    由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息

414     Request-URI Too Large       请求的URI过长(URI通常为网址),服务器无法处理

415     Unsupported Media Type      服务器无法处理请求附带的媒体格式

416     Requested range not satisfiable     客户端请求的范围无效

417     Expectation Failed          服务器无法满足Expect的请求头信息

500     Internal Server Error       服务器内部错误,无法完成请求

501     Not Implemented             服务器不支持请求的功能,无法完成请求

502     Bad Gateway                 充当网关或代理的服务器,从远端服务器接收到了一个无效的请求

503     Service Unavailable         由于超载或系统维护,服务器暂时的无法处理客户端的请求。延时的长度可包含在服务器的Retry-After头信息中

504     Gateway Time-out            充当网关或代理的服务器,未及时从远端服务器获取请求

505     HTTP Version not supported      服务器不支持请求的HTTP协议的版本,无法完成处理
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,539评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,911评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,337评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,723评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,795评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,762评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,742评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,508评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,954评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,247评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,404评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,104评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,736评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,352评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,557评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,371评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,292评论 2 352

推荐阅读更多精彩内容