1、HTTP与TCP关系
1.1 什么是HTTP协议
HTTP(Hypertext Transfer Protocol ,超文本传输协议)是一个简单的请求-响应协议,它通常运行在TCP之上。
2、url
URL(Uniform Resource Locator) 地址用于描述一个网络上的资源, 基本格式如下
schema://host[:port]/path/.../[?query-string][#anchor]
scheme: 指定低层使用的协议(例如:http, https, ftp)
host: HTTP服务器的IP地址或者域名
port: HTTP服务器的默认端口是80,这种情况下端口号可以省略。如果使用了别的端口,必须指明,例如 http://www.cnblogs.com:8080/
path: 访问资源的路径
query-string: 发送给http服务器的数据
anchor: 锚
3、请求报文
先看Request 消息的结构, Request 消息分为3部分,第一部分叫Request line, 第二部分叫Request header, 第三部分是body. header和body之间有个空行, 结构如下图
3.1 Request line
请求的第一行是“方法 URL 议 / 版本”: GET/sample.jsp HTTP/1.1
以上代码中“ GET ”代表请求方法,“ /index.xml ”表示 URI ,“ HTTP/1.1 代表协议和协议的版本。
根据 HTTP 标准, HTTP 请求可以使用多种请求方法。例如: HTTP1.1 目前支持 7 种请求方法: GET 、 POST 、 HEAD、 OPTIONS 、 PUT 、 DELETE 和 TARCE 。
GET: 请求获取由Request-URI所标识的资源。
POST: 在Request-URI所标识的资源后附加新的数据。
HEAD: 请求获取由Request-URI所标识的资源的响应消息报头。
OPTIONS: 请求查询服务器的性能,或查询与资源相关的选项和需求。
PUT: 请求服务器存储一个资源,并用Request-URI作为其标识。
DELETE: 请求服务器删除由Request-URI所标识的资源。
TRACE: 请求服务器回送收到的请求信息,主要用语测试或诊断。
3.1.1 GET和POST区别
- GET提交的数据会放在URL之后,以?分割URL和传输数据,参数之间以&相连,如EditPosts.aspx?name=test1&id=123456. POST方法是把提交的数据放在HTTP包的Body中.
- GET提交的数据大小有限制(因为浏览器对URL的长度有限制),而POST方法提交的数据没有限制.
- GET方式需要使用Request.QueryString来取得变量的值,而POST方式通过Request.Form来获取变量的值。
- GET方式提交数据,会带来安全问题,比如一个登录页面,通过GET方式提交数据时,用户名和密码将出现在URL上,如果页面可以被缓存或者其他人可以访问这台机器,就可以从历史记录获得该用户的账号和密码.
3.2 Request header
下面列举一些常用的request header:
Header | 解释 | 示例 |
---|---|---|
Accept | 指定客户端能够接收的内容类型 | Accept:text/plain,text/html |
Accept-Charset | 浏览器可以接受的字符编码集。 | Accept-Charset:iso-8859-5 |
Accept-Encoding | 指定浏览器可以支持的web服务器返回内容压缩编码类型。 | Accept-Encoding:compress,gzip |
Accept-Language | 浏览器可接受的语言 | Accept-Language:en,zh |
Accept-Ranges | 可以请求网页实体的一个或者多个子范围字段 | Accept-Ranges:bytes |
Authorization | HTTP授权的授权证书 | Authorization:Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ== |
Cache-Control | 指定请求和响应遵循的缓存机制 | Cache-Control:no-cache |
Connection | 表示是否需要持久连接。 | (HTTP 1.1默认进行持久连接) Connection:close |
Cookie | HTTP请求发送时,会把保存在该请求域名下的所有cookie值一起发送给web服务器。 | Cookie:$Version=1;Skin=new; |
Content-Length | 请求的内容长度 | Content-Length:348 |
Content-Type | 请求的与实体对应的MIME信息 | Content-Type:application/x-www-form-urlencoded |
Date | 请求发送的日期和时间 | Date:Tue,15 Nov 2010 08:12:31 GMT |
Expect | 请求的特定的服务器行为 | Expect:100-continue |
From | 发出请求的用户的Email | From:user@email.com |
Host | 指定请求的服务器的域名和端口号 | Host:www.zcmhi.com |
If-Match | 只有请求内容与实体相匹配才有效 | If-Match:“737060cd8c284d8af7ad3082f209582d” |
If-Modified-Since | 如果请求的部分在指定时间之后被修改则请求成功,未被修改则返回304代码 | If-Modified-Since:Sat,29 Oct 2010 19:43:31 GMT |
If-None-Match | 如果内容未改变返回304代码,参数为服务器先前发送的Etag,与服务器回应的Etag比较判断是否改变 | If-None-Match:“737060cd8c284d8af7ad3082f209582d” |
If-Range | 如果实体未改变,服务器发送客户端丢失的部分,否则发送整个实体。参数也为Etag | If-Range:“737060cd8c284d8af7ad3082f209582d” |
If-Unmodified-Since | 只在实体在指定时间之后未被修改才请求成功 | If-Unmodified-Since:Sat,29 Oct 2010 19:43:31 GMT |
Max-Forwards | 限制信息通过代理和网关传送的时间 | Max-Forwards:10 |
Pragma | 用来包含实现特定的指令 | Pragma:no-cache |
Proxy-Authorization | 连接到代理的授权证书 | Proxy-Authorization:Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ== |
Range | 只请求实体的一部分,指定范围 | Range:bytes=500-999 |
Referer | 先前网页的地址,当前请求网页紧随其后,即来路 | Referer:http: |
TE | 客户端愿意接受的传输编码,并通知服务器接受接受尾加头信息 | TE:trailers,deflate;q=0.5 |
Upgrade | 向服务器指定某种传输协议以便服务器进行转换(如果支持) | Upgrade:HTTP/2.0,SHTTP/1.3,IRC/6.9,RTA/x11 |
User-Agent | User-Agent的内容包含发出请求的用户信息 | User-Agent:Mozilla/5.0(Linux;X11) |
Via | 通知中间网关或代理服务器地址,通信协议 | Via:1.0 fred,1.1 nowhere.com(Apache/1.1) |
Warning | 关于消息实体的警告信息 | Warn:199 Miscellaneous warning |
3.3 Request body
3.3.1 GET Request
当使用的是"GET" 方法的时候, body是为空的
3.3.2 POST Request
post的body通常是自己定义的,一般消息传递会用字符串,上传传文件直接用二进制也可以
4、响应
我们再看Response消息的结构, 和Request消息的结构基本一样。 同样也分为三部分,第一部分叫Response line, 第二部分叫Response header,第三部分是body. header和body之间也有个空行, 结构如下图
4.1 状态行
响应的第一行被称为状态行,内容包含3部分:
版本: 如 HTTP/1.1
状态码 如 200
状态消息 一般是说明状态码的 200时为OK
4.1.1 状态码的类别:
状态码 | 类别 | 原因短语 |
---|---|---|
1XX | Informational(信息性状态码) | 接受的请求正在处理 |
2XX | Success(成功状态码) | 请求正常处理完毕 |
3XX | Redirection(重定向状态码) | 需要进行附加操作以完成请求 |
4XX | Client Error(客户端错误状态码) | 服务器无法处理请求 |
5XX | Server Error(服务器错误状态码) | 服务器处理请求出错 |
4.1.2 常见的14中状态码
2XX——表明请求被正常处理了
1、200 OK:请求已正常处理。
2、204 No Content:请求处理成功,但没有任何资源可以返回给客户端,一般在只需要从客户端往服务器发送信息,而对客户端不需要发送新信息内容的情况下使用。
3、206 Partial Content:是对资源某一部分的请求,该状态码表示客户端进行了范围请求,而服务器成功执行了这部分的GET请求。响应报文中包含由Content-Range指定范围的实体内容。
3XX——表明浏览器需要执行某些特殊的处理以正确处理请求
4、301 Moved Permanently:资源的uri已更新,你也更新下你的书签引用吧。永久性重定向,请求的资源已经被分配了新的URI,以后应使用资源现在所指的URI。
5、302 Found:资源的URI已临时定位到其他位置了,姑且算你已经知道了这个情况了。临时性重定向。和301相似,但302代表的资源不是永久性移动,只是临时性性质的。换句话说,已移动的资源对应的URI将来还有可能发生改变。
6、303 See Other:资源的URI已更新,你是否能临时按新的URI访问。该状态码表示由于请求对应的资源存在着另一个URL,应使用GET方法定向获取请求的资源。303状态码和302状态码有着相同的功能,但303状态码明确表示客户端应当采用GET方法获取资源,这点与302状态码有区别。
当301,302,303响应状态码返回时,几乎所有的浏览器都会把POST改成GET,并删除请求报文内的主体,之后请求会自动再次发送。
7、304 Not Modified:资源已找到,但未符合条件请求。该状态码表示客户端发送附带条件的请求时(采用GET方法的请求报文中包含If-Match,If-Modified-Since,If-None-Match,If-Range,If-Unmodified-Since中任一首部)服务端允许请求访问资源,但因发生请求未满足条件的情况后,直接返回304.。
8、307 Temporary Redirect:临时重定向。与302有相同的含义。
4XX——表明客户端是发生错误的原因所在。
9、400 Bad Request:服务器端无法理解客户端发送的请求,请求报文中可能存在语法错误。
10、401 Unauthorized:该状态码表示发送的请求需要有通过HTTP认证(BASIC认证,DIGEST认证)的认证信息。
11、403 Forbidden:不允许访问那个资源。该状态码表明对请求资源的访问被服务器拒绝了。(权限,未授权IP等)
12、404 Not Found:服务器上没有请求的资源。路径错误等。
5XX——服务器本身发生错误
13、500 Internal Server Error:貌似内部资源出故障了。该状态码表明服务器端在执行请求时发生了错误。也有可能是web应用存在bug或某些临时故障。
14、503 Service Unavailable:抱歉,我现在正在忙着。该状态码表明服务器暂时处于超负载或正在停机维护,现在无法处理请求。
4.2 Reponse Header
可以参考Request Header
4.3 Respons Body
body部分就是服务端向客户端发送的实际数据,一般都是自己定义的数据格式和内容,当然一般都是采用通用的数据格式,如传消息一般用json,传图片和视频用原本的封装格式。