HTTP简介:
超文本传输协议,是用于从万维网服务器传输超文本到本地浏览器的传送协议。HTTP是一个基于TCP/IP通信协议来传递数据(HTML 文件, 图片文件, 查询结果等)。HTTP使用统一资源标识符(Uniform Resource Identifiers, URI)来传输数据和建立连接。
HTTP 工作原理:
HTTP协议工作于客户端-服务端架构为上。浏览器作为HTTP客户端通过URL向HTTP服务端即WEB服务器发送所有请求。Web服务器根据接收到的请求后,向客户端发送响应信息。HTTP默认端口号为80
HTTP三大特点:
HTTP是无连接:无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
HTTP是媒体独立的:这意味着,只要客户端和服务器知道如何处理的数据内容,任何类型的数据都可以通过HTTP发送。客户端以及服务器指定使用适合的MIME-type内容类型。
HTTP是无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。
客户端请求消息:
请求行(request line)、请求头部(header)、空行 、请求数据(body)
服务器响应消息:
状态行、消息报头、空行和响应正文。
HTTP请求方法:
HTTP1.0定义了三种请求方法: GET, POST 和 HEAD方法。
HTTP1.1新增了五种请求方法:OPTIONS, PUT, DELETE, TRACE 和 CONNECT 方法。
HTTP状态码分类:HTTP状态码由三个十进制数字组成,第一个十进制数字定义了状态码的类型,后两个数字没有分类的作用。HTTP状态码共分为5种类型:
200 OK:成功处理,返回内容;
204 No Content成功处理,没有内容返回;
206 Partial Content:使用Content-Range指定返回内容;
301 Moved Permanently:永久性重定向,表示该资源的URI已经发生了变化;以后应该使用新的URI;书签需要更新;
302 Found:临时性重定向;表示该资源的URI临时发生了变化,以后还有可能会变;不会更新书签;
303 See Other:表示该资源的URI临时发生了变化,只能按照GET去访问新的URI;
304 Not Modified:不包含任何实体部分;资源未修改,一般在校验缓存新鲜度时会返回;
400 Bad Request:请求报文存在语法错误;
401 Unauthorized:请求需要通过HTTP认证;返回的401响应必须包含一个WWW-Authoricate首部用以质询用户信息;
403 Forbidden:访问被服务器拒绝;
404 Not Found: 服务器上没有访问的资源;
500 Intervalnal Server Error 服务费执行请求时发生了错误;
503 Service Unavailable: 服务器处于超负载或者正在进行停机维护;‘
HTTP :content-type
Content-Type,内容类型,一般是指网页中存在的Content-Type,用于定义网络文件的类型和网页的编码,决定浏览器将以什么形式、什么编码读取这个文件,这就是经常看到一些Asp网页点击的结果却是下载到的一个文件或一张图片的原因。
长连接、短连接:
参考资料
HTTP协议的长连接和短连接,实质上是TCP协议的长连接和短连接。
HTTP/1.0中,默认使用的是短连接:浏览器和服务器每进行一次HTTP操作,就建立一次连接,但任务结束就中断连接。
HTTP/1.1起,默认使用长连接: 在使用长连接的情况下,当一次HTTP操作完成后,客户端和服务器之间用于传输HTTP数据的 TCP连接不会关闭,如果客户端再次访问这个服务器,会继续使用这一条已经建立的连接。可以通过Keep-Alive来设置保持时间。
二者比较
长连接可以省去较多的TCP建立和关闭的操作,减少浪费,节约时间,对于频繁请求资源的客户来说,较适用长连接。
短连接对于服务器来说管理较为简单,存在的连接都是有用的连接,不需要额外的控制手段。但如果客户请求频繁,将在TCP的建立和关闭操作上浪费时间和带宽。
WEB网站的http服务一般都用短链接。
数据库的连接用长连接
《权威指南笔记》:
**重点:基本,缓存,基本认证,摘要认证,代理,连接管理,Cookie,HTTPS **
资源:服务器上的HTML文件,图片,视频等等
URI:统一资源标识符;定义怎么去标识互联网上的资源;唯一地标识; 如果这个标识是一个可获取到上述资源的路径,那么同时它也可以是一个 URL
URL:统一资源定位符;不仅定义怎么去标识互联网上的资源,还定义了怎么去访问资源;URL 是 URI 的子集;
URL的标准格式:
方案:访问资源所用的协议(HTTP);
因特网地址
资源
URN:统一资源名;作为特性资源的唯一名称,与位置无关;未大量使用,实验阶段;
参考资料1
参考资料2
媒体类型:MIME类型是一种文本标记,表示一种主要的对象类型和一个特定的子类型;中间用一条/隔开
事务:一条HTTP事务由一个HTTP请求命令和一个响应结果组成;
代理:位于客户端和服务器之间的中间代理;代理位于客户端和服务器之间,接收所有的客户端请求,并将它们转发给服务器;代理还可以对请求和响应进行过滤;
网关:是一种特殊的服务器,作为其它服务器的中间实体使用。通常用于将HTTP流量转换为其它协议;
隧道:是在连接建立起来后,就会在两条连接之间对原始数据进行盲转发的HTTP应用程序;常用来在一条或者多条HTTP连接上转发非HTTP数据;
隧道的应用:通过HTTP连接来承载加密的安全套接字层(SSL)流量;这样SSL流量就可以通过只允许Web流量通过的防火墙了;HTTP/SSL隧道收到一条HTTP请求,先建立连接,然后通过隧道传输SSL流量;
Agent代理:代表用户发起HTTP请求的客户端程序;Web浏览器;