HTTP协议定义
http是一个客户端和服务器端请求和应答的标准,客户端是终端用户,服务器端是网站。通过使用web浏览器,网络怕从或者其他的工具,客户端发起一个到服务器上指定端口(默认80端口)的http请求,这个客户端也被叫做用户代理(user agent),应答的服务器上存储着一些数据,我们称这个应答服务器为源服务器,在用户代理和源服务器中间可能存在多个中间层,比如代理,网管,或者隧道,尽管TCP/IP协议是互联网上最流行的应用,HTTP协议并没有规定必须使用他们,HTTP可以在任何其他互联网协议上,http只假定(其下层协议提供)可靠的传输,任何能够提供这种保证的协议都可以被使用,HTTP使用TCP而不是UDP的原因在于(打开)一个网页必须传送很多数据,而TCP协议提供传输控制,按顺序组织数据,和错误纠正
HTTP协议功能
HTTP协议是用于从WWW服务器传输超文本到本地浏览器的传输协议,它可以使浏览器更加高效,使网络传输减少,它不仅保证计算机正确快速的传输超文本文档,还确定传输文档中的那一部分,以及哪部分内容首先显示(如文本先与图形)等 HTTP是客户端浏览器或其他程序与Web服务器之间的应用层通信协议,在因特网上的web服务器上存放的都是超文本信息,客户机需要通过HTTP协议传输要访问的超文本信息,HTTP包含命令和传输信息,所以也可以同于其他因特网/内联网应用系统之间的通信,从而实现各类应用资源超媒体访问的集成,我们在浏览器的地址栏里输入的网站地址叫做URL(统一资源定位符)
HTTP协议版本
HTTP/1.0发送请求,创建一次连接,获得一个web资源,连接断开
HTTP/1.1 发送请求,创建一次连接,获得多个web资源,连接断开
HTTP协议的组成
HTTP协议由http请求和http响应组成
请求包括:请求行,请求头,请求体
响应包括:响应行,响应头,响应体
请求行:POST/chapter17/user.html HTTP/1.1
格式:请求方式 资源路径 协议/版本
请求行必须在http请求格式的第一行
get请求:将请求参数追加在url后面,不安全,url长度限制了get请求方式数据的大小 没有请求体,一般的HTTP请求都是GET
post请求:请求参数在请求体处,较安全,请求数据大小没有显示,只有表单设置为method="post"才是post请求,其他都是get请求
其他的请求方式还有:HEAD(类似get,不过服务器只返回响应头)DELETE请求:删除某一个资源 PUT请求:把资源放在指定位置
请求头从第二行开始,到第一个空格结束,请求头和请求体之间存在一个空格行 ,请求头通常以键值对方式传递数据
请求报文头属性:
referer:表示这个请求是从哪个url调过来的,通过百度籁搜索淘宝网,那么在进入淘宝网的请求报文中,referer的值就是:www.baidu.com 如果是直接访问就不会有这个头 常用于防盗链
Accept:告诉服务端,该请求所能支持的响应数据类型,专业术语成为MIME类型(文件类型的一种描述方式)Accept:text、html,application/xhtml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8
MIME格式:大类型/小类型;参数
if-Modified-Sincce:浏览器通知服务器,本地缓存的最后变更时间。与另一个响应头组合控制浏览器页面的缓存
Cokkie:客户端的Cookie就是通过这个报文头属性传给服务端的 这里就有一个问题 网站A怎么保证自己请求体中保存的cookie就是网站A而不是其他网站的,这就和cookie里面的jsessionid有关系详情参考http://www.cnblogs.com/fnng/archive/2012/08/14/2637279.html
User-Agent:浏览器通知服务器,客户端浏览器与操作系统相关信息
Connection:表示客户端与服务连接类型;Keep-Alive表示持久连接,close已关闭
Host:请求的服务器主机名
Content-Length:请求体的长度
Content-Type:请求的与实体对应的MIME信息,如果是post请求,会有这个头,默认值为application/x-www-form-urlencoded,表示请求体内容使用url编码
Accept-Encoding:浏览器通知服务器,浏览器支持的数据压缩格式,如gzip压缩
Accept-language:浏览器通知服务器,浏览器支持的语言,各国语言
Cache-Control:指定请求和响应遵循的缓存机制,对缓存进行控制,如一个请求希望响应返回的内容在客户端要被缓存一年,或不希望被缓存就可以通过这个报文打到目的
请求体:
当请求方式是post时,请求体会有请求的参数,格式如下username=zhangsan&password=123
HTTP响应报文
HTTP的响应报文也由三部分组成(响应行+响应头+响应体)
响应行:1 报文协议及版本;2 状态码及状态描述
状态码由三位数字组成,第一个定义了响应的类别 1xx:指示信息,表示请求已接受,继续处理
2xx:成功,表示请求已被成功接收,处理(200 ok:客户端请求成功, 204 No Content:无内容,服务器成功处理,但未返回内容,一般用在指示客户端向服务器发送信息,而服务器不用向客户端返回什么信息的情况,不会刷新页面, 206 Partial Content:服务器已经完成了部分get请求(客户端进行了范围请求)。响应报文中包含了Content-Range指定范围的实体内容
3xx :重定向 301:永久重定向,表示请求的资源已经永久搬到了其他位置 302:临时重定向,表示请求的资源零食搬到了其他位置 304:表示客户端发送附带条件的请求时(get办法请求报文中的IF)条件不满足,返回304时,不包含任何响应主体
4xx:客户端错误 400:客户端请求有语法错误,服务器无法理解 401:请求未经授权,这个状态代码必须和WWW-Authenticate报头域一起使用 403:服务器收到请求,但是拒绝提供服务 404:请求资源不存子啊 比如,输入了错误的url 415:不支持的媒体类型
5xx:服务器端错误。服务器未能实现合法的请求 500:服务器发生不可预期的错误 503:服务器当前不能处理客户端的请求,一段时间后可能恢复正常
响应报文头,也是由多个属性组成 服务器通过响应头籁控制浏览器的行为,不同的头浏览器操作不同
常见的响应头:
Content-Type:
multipart/form-data:常见的POST数据提交的方式,我们使用表单上传文件时,必须让form的enctyped等于这个值
application/json 这个作为请求头时用来告诉服务端消息主体是序列化后的JSON字符串,由于json规范的流行,出了底版本ie之外的各大浏览器都原生支持JSON.stringify,服务端语言也都有处理json的函数,使用JSON不会遇上什么麻烦,JSON格式支持比键值对复杂得多的结构化数据